13.05 AIGC商品图批量生成工作流:从SD到落地实战
一、问题
痛点: 电商店铺每季度上新50-100个SKU,每个SKU需要主图+场景图+细节图+白底图+模特图,合计5-8张。找摄影外包:1个SKU约200-500元,50个SKU就是1-2.5万元。更麻烦的是,每次换季都要重拍,一年4季至少8-10万。而且拍摄周期长,从找模特到修图出片至少2周。 典型困境:- 拍摄成本高:一个SKU全套图300-800元(含模特+场景+修图)
- 周期长:从约拍到出片7-14天
- 灵活度低:想换场景或模特只能重拍
- 竞品AI出图又快又便宜,不吃亏吗?
二、学习:AIGC商品图技术栈(2026年最新)
主流方案对比
| 方案 | 出图质量 | 成本 | 速度 | 学习门槛 | 适用场景 |
|------|---------|------|------|---------|---------|
| Stable Diffusion本地部署 | ⭐⭐⭐⭐⭐ | GPU电费 | 30秒/张 | ★★★★ | 批量生产、精细控制 |
| Midjourney | ⭐⭐⭐⭐⭐ | 30美元/月 | 30秒/张 | ★★☆ | 创意探索、小批量 |
| 通义万相(阿里) | ⭐⭐⭐⭐ | 免费/按量 | 10秒/张 | ★☆☆ | 快速出图、国内合规 |
| 文心一格(百度) | ⭐⭐⭐☆ | 免费/按量 | 10秒/张 | ★☆☆ | 国内电商场景 |
| 腾讯智影 | ⭐⭐⭐ | 免费基础版 | 5秒/张 | ★☆☆ | 零门槛快速入局 |
| ComfyUI工作流 | ⭐⭐⭐⭐⭐ | GPU电费 | 1分钟/张 | ★★★★★ | 生产级流水线 |
2026年推荐方案: 本地ComfyUI + LoRA微调(质量最高)+ 通义万相(快速出图辅助)SD核心术语速懂
| 术语 | 通俗解释 | 电商使用 |
|------|---------|---------|
| Checkpoint(大模型) | AI的"画风基础" | 用写实类:Realistic Vision、MajicMix |
| LoRA | AI的"滤镜/技能" | 训练商品专属LoRA,保证一致性 |
| ControlNet | AI的"参考线" | 保持商品轮廓/姿势/构图不变 |
| IP-Adapter | AI的"风格参考" | 参考一张图生成同风格不同图 |
| Prompt | 告诉AI画什么 | 写中文提示词(配合翻译) |
| Negative Prompt | 告诉AI别画什么 | 写"难看的、畸形的、模糊的" |
| CFG Scale | AI听指令的程度 | 6-8最常用,太大像复制太小像乱画 |
三、分析:AIGC商品图落地案例
某服装品牌(2026年Q1数据)
`
拍摄模式对比:
传统拍摄(2025年):
- SKU:80个
- 总费用:80×600=48,000元(含模特+场景+后期)
- 周期:21天
- 换季重拍费用:同样
AI生成模式(2026年Q1实践):
- 硬件投入:RTX 4090显卡×1台=1.6万元
- 单SKU成本:约5元(电费+算力)
- 80个SKU总成本:400元(数据+调试)
- 周期:3天出图+1天挑选精修
- 换季:只需换服装照片,场景/模特不变
投入产出:
- 季度节省:48,000-400=47,600元
- 节省时间:18天
- 预计年化节省:约19万元
- 额外价值:可以生成不同肤色的模特图、不同风格的场景图
`
AIGC商品图能做什么、不能做什么
能做:- ✅ 白底图换背景(衣服放到海滩/办公室/咖啡厅)
- ✅ 虚拟模特试穿(不同脸型、身材、肤色)
- ✅ 场景图批量生成(产品摆在家居场景中)
- ✅ 创意概念图(离谱但吸睛的创意主图)
- ✅ 细节放大(高清放大,展示材质纹理)
- ❌ 精细的细节一致性(拉链头方向、纽扣颜色)
- ❌ 复杂手部动作(手指交握戴项链等)
- ❌ 有商标/包装文字的高精度还原
- ❌ 需要特定真实模特肖像权授权的场景
四、理解:AIGC商品图的底层逻辑
AIGC商品图本质是"用计算代替实物,用数据代替拍摄"。
底层逻辑拆解:
> 核心法则:AI负责创意和效率,人负责质量和判断。 不要期望AI一键生成完美商品图。
五、内化:一句话AIGC商品图
拍一张好照片(产品)+ 写一段好提示词(场景)= 获得100张不同场景的商品图。你的核心工作量从"拍摄+修图"变成了"拍摄(1次)+调参(批量)"。
六、类比:AIGC像拍照时换背景布
传统商业拍摄:模特+产品在棚里→换一块背景布→再拍一组→再换背景布→再拍。
AIGC商品图:拍一次产品白底图→用PS一键换背景→换100个不同背景。
区别是AI能换的背景比真实布景丰富100倍(外太空、海底、卡通世界),且成本几乎为零。
但核心逻辑不变:先有好的"底图",再换"背景"。 没有好的产品照片做底子,AI也救不了。
七、迁移:从AIGC商品图到更多应用
应用到视频场景
- AI商品视频:Stable Video Diffusion / Pika Labs
- 生成立体的360度旋转展示视频
- 生成商品的使用场景短视频
应用到跨境电商
- 同一商品生成不同肤色的模特图(对标不同国家市场)
- 美国站用白人模特、中东站带头巾、东南亚站用偏黄肤色
- 背景换上当地地标(纽约/东京/巴黎)
应用到广告素材A/B测试
- 批量生成100张不同风格的主图
- 投放到千川/巨量看CTR表现
- 找到最优风格后批量生产同风格素材
八、实践:从零开始搭建AIGC商品图流水线
准备工作
硬件:- 入门:RTX 3060 12GB(慢但能用),二手约2000元
- 推荐:RTX 4090 24GB(流畅),约1.6万
- 云GPU:AutoDL等平台,约3-5元/小时,按需用
- ComfyUI(推荐,生产级工作流)
- SD WebUI(Stable Diffusion WebUI,适合新手)
- Python 3.10+
实战工作流:批量换背景(最常用场景)
#### Step 1:准备产品白底图
`
要求:
- 纯白背景(RGB 255,255,255或接近)
- 产品光线均匀,没有明显阴影
- 分辨率至少1024×1024
- 格式PNG(保留透明度可选)
拍1张就够了,不需要拍100张。
`
#### Step 2:安装ComfyUI并加载工作流
安装步骤(简版):
`
- ControlNet辅助套件
- WAS Node Suite(图片处理)
- Efficiency Nodes(批量处理)
`
#### Step 3:建立换背景工作流
核心节点链:`
[Load Image(导入产品图)]
↓
[Remove Background(去背景,用RMBG模型)]
↓
[Load Checkpoint(加载写实大模型,如RealVisXL)]
↓
[CLIP Text Encode(写场景提示词)]
↓
[ControlNet Inpainting(锁定产品区域)]
↓
[KSampler(生成)]
↓
[VAE Decode(解码)]
↓
[Save Image(保存)]
`
提示词模板(生产用):
`
正向:best quality, masterpiece, product photography,
[产品名] on wooden table, morning sunlight, coffee shop,
interior design, professional lighting, 8k, sharp focus
负向:worst quality, low quality, blurry, distorted,
mutated hands, ugly, watermark, text, signature, logo
`
#### Step 4:批量生成
`python
批量生成的简化脚本思路
在ComfyUI中配置Batch Size和Repeat Count
场景清单(提前写好10-20个场景)
scenes = [
"on wooden table near window, morning light",
"in modern kitchen, white marble countertop",
"on beach towel, ocean view, golden hour",
"in coffee shop, latte art background, warm lighting",
"on office desk, next to laptop, work scene",
]
每个场景生成2-4张,共20-80张图
挑选最优的10-20张用于上架
`
#### Step 5:后期处理
`
`
高级技巧:训练商品专属LoRA
如果商品外观特别(包装独特、造型另类),需要训练LoRA模型保证一致性:
`
复杂度:★★★★★
效果:一致性提升到95%以上
推荐:只有高复用的SKU才值得训练(爆款/主推款)
`
九、调整:常见错误与避坑
错题本
| 错误 | 后果 | 正确做法 |
|------|------|---------|
| 直接拿AI原图做主图 | 细节崩坏(手指6根、字体模糊) | 必须精修+高清放大 |
| 产品角度不一致 | 同一SKU的图看起来像不同产品 | 用相同底图,只换场景 |
| 使用在线工具不加版权排查 | 有侵权风险(商用的严格限制) | 本地部署SD+自训练模型 |
| 只做1-2个场景 | 详情页素材单一 | 至少5个不同场景 |
| 不调色直接上架 | 色调和店铺风格不统一 | 用LR预设批量调色 |
| 忽略手机显示效果 | PC上好看到手机上糊了 | 在手机上预览再上传 |
| 场景太假(漂浮感) | 用户一眼看出是AI生成,信任降低 | 加阴影、调光影融合 |
实用技巧
十、成事:不同规模的AIGC商品图方案
小卖家(月GMV<50万,SKU<30个)
- 方案:通义万相免费版+剪映
- 成本:0元
- 流程:用通义万相"商品嵌入"功能→一键换背景→剪映调色
- 速度:1个SKU约10分钟
- 适合:不想折腾技术,先体验AI
中型卖家(月GMV 50-500万,SKU 30-200个)
- 方案:ComfyUI本地(单卡4090)
- 成本:显卡1.6万(一次性)+ 电费
- 流程:本地工作流批量换背景→人工挑选→LR批量调色
- 速度:1个SKU 10个场景约1小时(含挑选)
- 适合:有基本技术能力,需批量生产
大卖/品牌(月GMV>500万,SKU 200+)
- 方案:ComfyUI多卡集群 + 自训练LoRA
- 成本:显卡×3 + 技术人员
- 流程:商品专属LoRA训练→全自动批量生成→质检→上架
- 速度:1个SKU 30个场景约30分钟
- 适合:需要品牌统一的视觉标准
---
关联笔记:- 参见 13.02-电商数据看板搭建实战 —— AI出图后看CTR数据反馈
- 参见 13.06-电商AB测试框架设计 —— 用AB测试验证AI图vs实拍图的效果
- 参见 13.10-千川投流策略 —— AI生成的图片投放到千川