同群分析(Cohort Analysis):从数据表象到用户行为本质洞察
核心概念与问题定义
同群分析(Cohort Analysis)是电商留存分析最强大的工具之一,它将用户按「首次行为时间」分组(同群),然后跟踪每个群组在后续时间的表现。核心目的:区分「时间效应」和「群组效应」。
举个例子:某电商平台1月留存率50%,2月降至40%。是因为2月的用户质量变差了?还是2月本身天数少/春节假期影响?Cohort Analysis可以告诉你答案。
常见的Cohort分析类型:关键参数与案例
Cohort留存率计算标准:`
第N期留存率 = 该群中第N期有消费的用户数 ÷ 群组总用户数
`
经典Cohort表结构示例(月度数据):
| 注册月份 | 用户数 | 当月消费 | 次月消费 | 第二个月 | 第三个月 | 第六个月 |
|---------|-------|---------|---------|---------|---------|---------|
| 2025-01 | 10,000 | 100% | 45% | 38% | 32% | 18% |
| 2025-02 | 12,000 | 100% | 42% | 35% | 28% | 15% |
| 2025-03 | 15,000 | 100% | 40% | 30% | 25% | — |
| 2025-04 | 18,000 | 100% | 38% | 28% | — | — |
| 2025-05 | 20,000 | 100% | 35% | — | — | — |
关键发现:- 1月群组(10,000用户)的6月留存率是18%
- 5月群组(20,000用户)的次月留存率只有35%
- 尽管新客数量在增长,但新客质量在持续下降——说明获客渠道在「放水」
- 通过好友分享注册的用户,次月留存率58%
- 通过广告注册的用户,次月留存率22%
- 通过搜索自然流量注册的用户,次月留存率36%
- 结论:社交裂变带来的用户质量最高,应该加大社交裂变投入,而非盲目扩大广告投放
自己的深度分析
Cohort Analysis最被低估的应用不是看留存本身,而是看「留存曲线的形态」。不同品类的留存曲线有标准形态:- 快消品:先陡降后平缓(用户试试→留下习惯)
- 耐用品:先平稳后陡降(买完需求满足后不再来)
- 订阅制:匀速下降(按月流失)
如果你的留存曲线形态和标准形态不一致,说明有问题——比如快消品电商的留存曲线第一个月下降了60%,说明「首次体验」环节出了问题。
Cohort的更深层应用是「行为Cohort」而非「时间Cohort」。时间Cohort只能回答「用户在什么时候来」,行为Cohort能回答「用户做了什么之后会回来」——比如「首次购买后7天内浏览过首页的用户,留存率是没浏览过的2倍」,这个发现直接指导产品设计。跨领域类比
Cohort Analysis就像农作物种植的批次跟踪:
- 同一批种子(同一Cohort的用户)在同一块地(同一产品体验),但不同季节播种(不同时间Cohort),收成会不同
- 如果5月种的那批(对应5月新增用户)收成明显差于4月种的,那可能不是因为5月的土地问题(产品变坏了),而是因为5月的种子质量不如4月(获客渠道质量下降)
- Cohort Analysis能帮助你「对种子溯源」——找到哪批种子出问题了
实操迁移建议
常见错误 / 错题本
- ❌ Cohort分得不够细——只用「月度」Cohort,没有按渠道、品类等维度做交叉Cohort
- ❌ 留存率分子/分母定义不统一——分子是「有登录」还是「有消费」?分母是「注册用户」还是「首次下单用户」?口径不同,数据不可比
- ❌ 忽略「幸存者偏差」——1月Cohort的用户到了第12个月还在买的,已经是「极端忠诚用户」,用他们来代表这个Cohort的所有用户会有偏差
- ❌ 只看数字不看业务背景——Cohort留存率突然下降,可能是因为做了促销导致大量低质量新客涌入,而不是产品变差了——这恰恰说明Cohort分析应该和业务事件对照着看
> 关联笔记:参见《AARRR转化漏斗模型:从拉新到裂变的全链路数据分析》
> 关联笔记:参见《北极星指标与OSM模型:从战略到执行的电商指标体系搭建》