06.19-电商推荐系统从入门到实战:协同过滤到深度学习
1. 问题:为什么"猜你喜欢"总是猜不中?
数据显示推荐系统在主流电商平台贡献30%-40%的成交额。但很多中小卖家觉得"猜你喜欢"是平台的事,和自己没关系。
坑:即使作为卖家,理解推荐系统的工作机制也能帮你:2. 学习:推荐系统的演进与核心架构
2.1 推荐系统三十年
| 阶段 | 时间 | 核心技术 | 代表模型/事件 |
|------|------|---------|-------------|
| 起源 | 1992-2005 | 协同过滤 | Tapestry(1992)、GroupLens(1994)、Amazon ItemCF(2003) |
| 发展 | 2006-2015 | 矩阵分解+特征工程 | Netflix Prize(2006)、SVD、FM+GBDT+LR |
| 成熟 | 2016-2022 | 深度学习 | Wide&Deep、DeepFM、DIN、召回-粗排-精排-重排架构 |
| 大模型 | 2023-至今 | 大语言模型 | LLM+推荐、生成式推荐、检索增强 |
2.2 电商推荐的"三驾马车"
#### 1. 协同过滤(Collaborative Filtering)
原理:和你有相似购买行为的人,他们买了什么你也可能喜欢。 两种变体:- User-Based CF:找相似的用户,推荐他们买过的东西(用户多时计算量大)
- Item-Based CF:找相似的商品,"买这个的人也买了……"(亚马逊经典方法,离线计算相似矩阵)
#### 2. 基于内容的推荐(Content-Based)
原理:你之前买了什么,就推荐类似属性的商品。 优点:没有冷启动问题、可解释性强 缺点:缺乏"惊喜度",只能推荐同质化商品#### 3. 混合推荐
原理:两种方法加权组合,取长补短。2.3 深度学习时代的标准架构
`
亿级商品库 → [召回] → 千级候选 → [粗排] → 百级候选 → [精排] → 数十个 → [重排] → 最终呈现
`
召回(Retrieval):毫秒级从亿级商品筛出千级候选。常用方法:
- 多路召回策略(同时跑多个简单模型)
- 向量化召回(用Embedding做相似度搜索)
- 热度召回(保底策略)
- Wide&Deep(Google 2016):两段式结构,兼顾记忆和泛化
- DeepFM(华为2017):FM+Deep,端到端学习特征交互
- DIN(阿里2018):注意力机制,给不同历史行为不同权重
2.4 电商推荐的核心指标
| 指标 | 全称 | 含义 | 电商典型值 |
|------|------|------|-----------|
| CTR | Click-Through Rate | 曝光到点击的比例 | 3%-10%(首页推荐位) |
| CVR | Conversion Rate | 点击到购买的比例 | 2%-8% |
| GMV贡献 | - | 推荐渠道带来的交易额 | 30%-40% |
| 多样性 | Diversity | 推荐结果的品类丰富度 | >50%(好) |
| 惊喜度 | Serendipity | 超出预期但合口味的推荐 | 难衡量,用A/B测 |
来源:腾讯云《推荐系统三十年:从协同过滤到大模型时代》(2025版)。
3. 分析:作为卖家的实战价值
3.1 系统怎么看你?
推荐系统看一个商品的角度(以淘宝为例):
| 维度 | 系统看什么 | 卖家能做什么 |
|------|----------|------------|
| 转化率 | 曝光→点击→收藏→加购→成交的比率 | 优化主图+价格+评价 |
| 新奇度 | 是否为平台稀缺品类 | 选品时关注竞争度 |
| 关联性 | 买A的人是否也买B? | 设计关联购买组合 |
| 用户反馈 | 好评率、退货率、投诉率 | 严控品控和售后 |
| 新鲜度 | 商品是否持续有更新/热度 | 定期优化SKU |
3.2 单品爆破的推荐系统视角
一个商品从0到爆的推荐路径:
3.3 禁忌:不要做的三件事
- 不要刷单(系统会直接把商品降权或封杀)
- 不要频繁改主图和价格(系统会把你看作不稳定商品)
- 不要上架就大量铺低价SKU(系统会用你的低价作为低价引流入口)
4. 理解:底层逻辑
推荐系统的本质是用户意图的预测与匹配。它不是在"猜你喜欢",而是在"根据你和其他人的行为模式,预测你可能会喜欢的商品,并帮你发现你不知道自己想要的商品"。
5. 内化
作为卖家,不需要懂推荐系统的算法实现,但要理解它的"思维模式":推荐系统是懒惰的——它倾向于推荐已经被验证过有人喜欢的商品。新品冷启动的难点就在这里:系统没有数据,怎么说服系统给你流量?
答案是:利用"新品扶持期"(所有平台都有),在系统给的小流量窗口里,用最好的主图+最优价格+真实好评,让CTR>CVR数据达标。
6. 类比迁移
| 领域 | 类比 |
|------|------|
| 餐厅推荐 | 协同过滤=你朋友吃了说好→推荐你去,内容推荐=你喜欢川菜→推荐另一家川菜馆 |
| 书店 | 协同过滤="买这本书的人也买了那本",内容推荐="作者/类型相同" |
| 音乐 | 协同过滤="听周杰伦的人也听林俊杰",内容推荐="节奏/风格相似" |
7. 迁移:电商卖家如何在推荐系统中占优
8. 实践:推荐系统工程化验证
如果平台开放推荐位A/B测试(如亚马逊的A+页面),可以做:
- 实验组:优化主图为CMB配色(点击率最优)
- 对照组:使用原图
- 观察48小时后,CTR提升>15%则全量切换
9. 调整
- 如果商品曝光量大但点击低 → 优化主图和标题(CTR问题)
- 如果点击多但成交少 → 优化详情页、评价、价格(CVR问题)
- 如果什么都没动但流量暴跌 → 检查是否被系统降权(查店铺违规)
10. 成事清单
- [ ] 检查所有商品的关键词/标题/类目标签是否准确
- [ ] 选一款新品,优化主图+价格,监控前7天的CTR/CVR
- [ ] 设计2-3个关联购买组合,让系统建立关联推荐
- [ ] 每周检查一次店铺评分,确保>4.5分
- [ ] 关注平台的"新品流量扶持"入口(一般在商家后台)
关联笔记
- 参见:02.16-跨境电商选品方法论(选品要考虑推荐系统的偏好)
- 参见:05.01-主图点击率优化(CTR是推荐系统的命门)
- 参见:06.05-AB测试实战(验证推荐位优化效果的科学方法)