06.18-电商多渠道归因分析:从末次点击到Shapley值
1. 问题:最后一枪背了所有的锅
投放了信息流广告、搜索竞价、小红书种草、朋友圈广告四类渠道。月末一看,所有转化都来自"搜索竞价"渠道。于是老板说:砍掉其他三个渠道,把钱全部投搜索。
坑:搜索竞价是"收割渠道"——用户在小红书种草、在信息流看到、在朋友圈被提醒,最后在搜索框里搜名字成交。砍掉种草渠道后,搜索竞价的转化也会暴跌。这就是归因分析要解决的核心矛盾:真正的功劳和最后的触点往往是两回事。
2. 学习:归因模型全解
2.1 什么是归因分析?
归因分析(Attribution Analysis)是一套规则/算法,用于确定转化路径中各个触点的功劳分配。
2.2 八大归因模型对比
#### 2.2.1 单触点归因(Single-Touch)
| 模型 | 规则 | 适用场景 | 局限 |
|------|------|---------|------|
| 首次互动 | 第一个渠道拿100%功劳 | 新品牌推广、品牌建设期 | 忽略后期助攻 |
| 末次互动 | 最后一个渠道拿100%功劳 | 短决策周期、竞品直接转化 | 忽略前期种草 |
| 末次非直接点击 | 排除直接输入后,最后一个渠道拿100% | 直接流量占比高时 | 依然只认一个触点 |
| 最后AD点击 | 最后一个广告点击拿100% | 广告效果评估 | 忽略自然流量作用 |
#### 2.2.2 多触点归因(Multi-Touch)
| 模型 | 规则 | 适用场景 | 局限 |
|------|------|---------|------|
| 线性归因 | 每个触点平均分配 | 品牌认知维系 | 高估边缘渠道影响 |
| 时间衰减 | 越靠近转化权重越大(7天半衰期) | 短销售周期(如快消) | 低估早期渠道价值 |
| 位置归因(U型) | 首尾各40%,中间平分20% | 重视线索+成交 | 忽略中间助攻 |
| 自定义 | 按业务经验设定权重 | 经验丰富团队 | 主观性强 |
#### 2.2.3 算法归因(Data-Driven)
##### 马尔科夫链归因(Markov Chain Attribution)
核心思想:把用户路径看作马尔科夫过程——用户在不同渠道间转移,最终达到"转化"或"流失"状态。通过移除某个渠道后转化概率的下降程度,衡量该渠道的贡献。 计算公式:`
渠道A的贡献 = 基础转化率 - 移除渠道A后的转化率
渠道A的移除效应 = (P(转化|全部渠道) - P(转化|移除A)) / P(转化|全部渠道)
`
Python实现示意:
`python
简化版马尔科夫链归因
用户路径示例: A→B→C→转化, A→C→流失, B→C→C→转化
1. 统计状态转移矩阵
2. 计算全渠道转化概率
3. 逐个移除渠道,计算转化概率变化
4. 变化量即为渠道贡献
`
##### Shapley值归因(Shapley Value Attribution)
核心思想:来自博弈论——将每个渠道看作一个"玩家",计算每个玩家在所有可能的渠道组合中的边际贡献平均值。 为什么用Shapley? 因为它满足四个公理:2.3 模型选择指南
| 业务场景 | 推荐模型 | 原因 |
|---------|---------|------|
| 新品牌推广 | 首次互动 | 关注获客渠道 |
| 搜索竞价为主 | 末次互动 | 简单直接 |
| 多渠道投放 | 马尔科夫/Shapley | 数据驱动 |
| 销售周期短(<3天) | 时间衰减 | 近因效应显著 |
| 品牌认知+效果兼顾 | 位置归因(U型) | 平衡拉新和转化 |
| 数据量大且有用户ID | Shapley值 | 最科学 |
来源:腾讯云《多渠道归因分析:传统归因》(2022版)+ CSDN多渠道归因系列。
3. 分析:不同模式的实际差异
某电商案例:用户转化路径数据
| 渠道 | 末次点击 | 首次点击 | 线性 | 时间衰减 | Markov | Shapley |
|------|---------|---------|------|---------|-------|---------|
| 搜索竞价 | 60% | 10% | 30% | 45% | 28% | 25% |
| 小红书种草 | 5% | 40% | 25% | 15% | 32% | 30% |
| 信息流广告 | 15% | 25% | 25% | 22% | 22% | 25% |
| 朋友圈广告 | 20% | 25% | 20% | 18% | 18% | 20% |
关键洞察:末次点击把搜索竞价高估了2倍,小红书被低估了6倍。如果用末次点击做预算分配,会大量砍种草预算,导致漏斗顶部枯竭。4. 理解:底层逻辑
归因分析的底层逻辑是反事实推理(Counterfactual Reasoning)——如果这个渠道不存在,转化会发生吗?如果不发生,说明这个渠道有不可替代的价值。
马尔科夫链和Shapley值本质上都在做这件事,只是做法不同:
- Markov:模拟"移除渠道"后的转化概率变化
- Shapley:计算"加入渠道"带来的边际价值
5. 内化
归因不是找一个"标准答案",而是理解不同归因视角下的偏差。末次点击是"临门一脚"视角,首次点击是"结缘"视角,Shapley是"公平分配"视角。
关键原则:不管选什么模型,保持一致。今天用末次点击,下个月用Shapley,数据不可比。6. 类比迁移
| 领域 | 类比 |
|------|------|
| 足球比赛 | 单触点=只看进球队员,多触点=算助攻,Shapley=从传控射全链路算贡献 |
| 项目管理 | 末次互动的PM=收尾的人拿全功,实际需求/设计/开发都有功劳 |
| 房产中介 | 通过链家看房、房天下看了3套、最后直接在贝壳成交——算谁的功劳? |
7. 迁移:电商归因落地方案
轻量级方案(电商初创,3-5个渠道)
进阶方案(M级别GMV,10+个渠道)
企业级方案(电商集团)
8. 实践:季度归因复盘SOP
第一周:数据采集(渠道投放数据+用户行为数据+转化数据) 第二周:模型运行(分别跑末次/首次/Markov/Shapley) 第三周:差异分析(哪个渠道在不同模型下差异最大?为什么?) 第四周:行动方案(调整预算分配,优化渠道组合)9. 调整
- 如果Shapley与业务直觉差距太大 → 先跑时间衰减作为交叉验证
- 如果渠道数超过10个 → 先合并同类项再用Shapley(否则计算量太大)
- 如果用户ID打通困难 → 先用设备ID作为唯一标识,再逐步升级
10. 成事清单
- [ ] 列出当前所有投放渠道(至少3个,电商通常5-10个)
- [ ] 确认是否能打通用户跨渠道行为(不能就先用末次点击)
- [ ] 选一个归因工具(GA4免费版够起步)
- [ ] 跑一次多渠道归因分析,标注各模型差异
- [ ] 根据差异最大的渠道,提出预算调整方案
关联笔记
- 参见:09-营销策划与品牌IP(归因分析是营销决策的数据基础设施)
- 参见:06.16-同期群分析(归因+Cohort配合使用验证渠道长期价值)
- 参见:06.04-转化漏斗分析(漏斗是归因的起点,归因是漏斗的延伸)