06.19-电商推荐系统从入门到实战：协同过滤到深度学习

1. 问题：为什么"猜你喜欢"总是猜不中？

数据显示推荐系统在主流电商平台贡献30%-40%的成交额。但很多中小卖家觉得"猜你喜欢"是平台的事，和自己没关系。

坑：即使作为卖家，理解推荐系统的工作机制也能帮你：

优化商品打标（让系统更容易理解你的商品）

设计正确的定价策略（推荐系统会"看"价格带）

策划单品爆破路径（让系统识别到你的商品受欢迎）

2. 学习：推荐系统的演进与核心架构

2.1 推荐系统三十年

| 阶段 | 时间 | 核心技术 | 代表模型/事件 |

|------|------|---------|-------------|

| 起源 | 1992-2005 | 协同过滤 | Tapestry(1992)、GroupLens(1994)、Amazon ItemCF(2003) |

| 发展 | 2006-2015 | 矩阵分解+特征工程 | Netflix Prize(2006)、SVD、FM+GBDT+LR |

| 成熟 | 2016-2022 | 深度学习 | Wide&Deep、DeepFM、DIN、召回-粗排-精排-重排架构 |

| 大模型 | 2023-至今 | 大语言模型 | LLM+推荐、生成式推荐、检索增强 |

2.2 电商推荐的"三驾马车"

#### 1. 协同过滤（Collaborative Filtering）

原理：和你有相似购买行为的人，他们买了什么你也可能喜欢。 两种变体：

User-Based CF：找相似的用户，推荐他们买过的东西（用户多时计算量大）

Item-Based CF：找相似的商品，"买这个的人也买了……"（亚马逊经典方法，离线计算相似矩阵）

优点：不需要了解商品属性，只看行为缺点：冷启动问题（新用户/新商品没有行为数据）

#### 2. 基于内容的推荐（Content-Based）

原理：你之前买了什么，就推荐类似属性的商品。优点：没有冷启动问题、可解释性强缺点：缺乏"惊喜度"，只能推荐同质化商品

#### 3. 混合推荐

原理：两种方法加权组合，取长补短。

2.3 深度学习时代的标准架构

亿级商品库 → [召回] → 千级候选 → [粗排] → 百级候选 → [精排] → 数十个 → [重排] → 最终呈现

` 召回（Retrieval）：毫秒级从亿级商品筛出千级候选。常用方法：

多路召回策略（同时跑多个简单模型）

向量化召回（用Embedding做相似度搜索）

热度召回（保底策略）

精排（Ranking）：对千级候选精细排序。常用模型：

Wide&Deep（Google 2016）：两段式结构，兼顾记忆和泛化

DeepFM（华为2017）：FM+Deep，端到端学习特征交互

DIN（阿里2018）：注意力机制，给不同历史行为不同权重

重排（Re-ranking）：考虑多样性、新鲜度、商业规则等

2.4 电商推荐的核心指标

| 指标 | 全称 | 含义 | 电商典型值 |

|------|------|------|-----------|

| CVR | Conversion Rate | 点击到购买的比例 | 2%-8% |

| GMV贡献 | - | 推荐渠道带来的交易额 | 30%-40% |

| 多样性 | Diversity | 推荐结果的品类丰富度 | >50%（好） |

来源：腾讯云《推荐系统三十年：从协同过滤到大模型时代》（2025版）。

3. 分析：作为卖家的实战价值

3.1 系统怎么看你？

推荐系统看一个商品的角度（以淘宝为例）：

| 维度 | 系统看什么 | 卖家能做什么 |

|------|----------|------------|

| 转化率 | 曝光→点击→收藏→加购→成交的比率 | 优化主图+价格+评价 |

| 新奇度 | 是否为平台稀缺品类 | 选品时关注竞争度 |

| 关联性 | 买A的人是否也买B？ | 设计关联购买组合 |

| 用户反馈 | 好评率、退货率、投诉率 | 严控品控和售后 |

| 新鲜度 | 商品是否持续有更新/热度 | 定期优化SKU |

3.2 单品爆破的推荐系统视角

一个商品从0到爆的推荐路径：

新品期：系统给少量曝光测试CTR（新商品有流量扶持）

观察期：CTR>CVR均达到阈值，系统增加曝光

起量期：更多用户交互→推荐系统给更多曝光

爆发期：进入"买A也买B"的关联推荐网络

成熟期：稳定流量，进入推荐系统的成熟商品池

关键：前3天的CTR决定了商品能否进入观察期。所以新品的主图、价格、标题是命门。

3.3 禁忌：不要做的三件事

不要刷单（系统会直接把商品降权或封杀）

不要频繁改主图和价格（系统会把你看作不稳定商品）

不要上架就大量铺低价SKU（系统会用你的低价作为低价引流入口）

4. 理解：底层逻辑

推荐系统的本质是用户意图的预测与匹配。它不是在"猜你喜欢"，而是在"根据你和其他人的行为模式，预测你可能会喜欢的商品，并帮你发现你不知道自己想要的商品"。

5. 内化

作为卖家，不需要懂推荐系统的算法实现，但要理解它的"思维模式"：推荐系统是懒惰的——它倾向于推荐已经被验证过有人喜欢的商品。新品冷启动的难点就在这里：系统没有数据，怎么说服系统给你流量？

答案是：利用"新品扶持期"（所有平台都有），在系统给的小流量窗口里，用最好的主图+最优价格+真实好评，让CTR>CVR数据达标。

6. 类比迁移

| 领域 | 类比 |

|------|------|

| 餐厅推荐 | 协同过滤=你朋友吃了说好→推荐你去，内容推荐=你喜欢川菜→推荐另一家川菜馆 |

| 书店 | 协同过滤="买这本书的人也买了那本"，内容推荐="作者/类型相同" |

| 音乐 | 协同过滤="听周杰伦的人也听林俊杰"，内容推荐="节奏/风格相似" |

7. 迁移：电商卖家如何在推荐系统中占优

精准打标：标题、关键词、类目准确填写，让系统知道你在卖什么

新品爆发：上新前3天集中做好主图和定价（决定CTR）

关联购买设计：用组合销售让系统建立"买A也买B"的关系

评价管理：保持高评分（95%以上好评是基础门槛）

稳定的运营节奏：不要三天打鱼两天晒网

8. 实践：推荐系统工程化验证

如果平台开放推荐位A/B测试（如亚马逊的A+页面），可以做：

实验组：优化主图为CMB配色（点击率最优）

对照组：使用原图

观察48小时后，CTR提升>15%则全量切换

9. 调整

如果商品曝光量大但点击低 → 优化主图和标题（CTR问题）

如果点击多但成交少 → 优化详情页、评价、价格（CVR问题）

如果什么都没动但流量暴跌 → 检查是否被系统降权（查店铺违规）

10. 成事清单

[ ] 检查所有商品的关键词/标题/类目标签是否准确

[ ] 选一款新品，优化主图+价格，监控前7天的CTR/CVR

[ ] 设计2-3个关联购买组合，让系统建立关联推荐

[ ] 每周检查一次店铺评分，确保>4.5分

[ ] 关注平台的"新品流量扶持"入口（一般在商家后台）

关联笔记

参见：02.16-跨境电商选品方法论（选品要考虑推荐系统的偏好）

参见：05.01-主图点击率优化（CTR是推荐系统的命门）

参见：06.05-AB测试实战（验证推荐位优化效果的科学方法）

资料来源

腾讯云《推荐系统三十年：从协同过滤到大模型时代》(https://cloud.tencent.com/developer/article/2608140)

Datawhale《深度推荐算法实践》(https://datawhalechina.github.io/fun-rec/)

Amazon《Item-to-Item Collaborative Filtering》(2003)

Google《Wide & Deep Learning for Recommender Systems》(2016)