在如今这个流量飙升、月入千万的时代,令人意外的是,AI 商品图却依然遭到“嫌弃”。一方面,尽管流量数据一路高涨,人们对于商品图的审美和品质要求却并未降低。AI 生成的商品图虽然在数量上能快速满足需求,但在细节、质感和创意上往往难以与专业摄影师拍摄的图片相媲美。另一方面,消费者越来越注重真实和个性化,AI 商品图的千篇一律无法满足他们对独特购物体验的追求。因此,即使流量再创新高,月入千万,AI 商品图仍需不断提升自身品质,以适应市场的变化和消费者的需求。
在过去近一年对全球AI图片赛道进行数据追踪后,会有一个比较清晰的感知是,AI商品图的头部产品在web端访问量屡创新高,在App端,每个月流水虽然不太稳定、但也在千万人民币之上,我们就预告了AI商品图的选题。没想到第一个加作者卡片的读者,就是一个在AI圈比较知名的创业者,上来直言,“这不是一个好赛道,太卷了”。而与这类产品从业者交流时,我们也差不多得到了同样的反馈。
不得不说,卷,确实符合我们对这个赛道的一贯观察。在玩家层面,因为锚定的是巨大的电商市场的作图痛点,在早期验证了PMF之后(Photoroom),被越来越多的创企和大厂看上,近一年,稿定科技、快手、阿里等先后入局。在流量层面,赛道头部产品的数据屡创新高,而中尾部产品/后入局者则数据惨淡,包括大厂在内,也难以起量。
但市场上同时也释放着另一层信号。随着技术不断创新,像是Photoroom这样原本主攻商品图(图片中没有“人”)的产品,开始做Virtual model这样生成模特图(图片中有人穿着或者佩戴产品)的功能。另外还有不少创企基于Kontext(黑森林最新模型,可多轮编辑保证一致性)开始推出与商品图和模特图相关的产品。
AI电商图片赛道,成了一座“围城”。
一、卷起来,难以进入的后来者
先以我们持续追踪的4款AI商品图产品的web端数据来观察分析。上图是过去12个月(2024年7月—2025年6月)4款产品的月访问数据,很容易得出赛道呈现两极分化走势的结论。
数据来源:非凡产研&点点数据/Sensor Tower/Product Hunt以及结合网页历史页面快照判断,仅供参考
从上线时间来看,海外创企是移动端App先行,后因为业务需要拓展到web端,而国内创企则是web端先行,符合AI这一波先做网页的典型特征。其中网旭科技的PicWish web端入局最早,但却在近一年一头扎入下降通道,稿定科技insMind入局最晚,曾凭借“吉卜力热潮”站上1000w+访问量水平线,但因为流量与产品本身定位不符,终究犹如黄粱一梦。
如今的局面是,AI商品图的新增流量基本被头部2个产品“截流”,中部产品只能固守,甚至守不住自己的流量,更遑论市场上还有一堆每月几万到几十万访问量的尾部产品。
究其原因,电商图片属于垂类领域(相对于所有泛化的AI图片编辑与生成)。在垂类场景下,一是,数据的累积作为行业know-how被反馈到技术和产品的改进中,会赋予头部产品更强的动能,最终体现为更强的产品力,2个头部产品的功能迭代也都更快一些。
二是,在形成较强的用户心智之后,产品对流量形成了一定的垄断(更多指web端,头部产品直接访问和自然搜索流量的同比增幅都在20%~30%之间,并且2个头部产品的付费搜索和展示广告相较于之前,也都有了更大的预算投入|数据来自SimilarWeb)。
以Photoroom为例,它最早在移动端验证了为电商卖家作图的需求,并基于使用数据不断训练和优化自己的图像分割模型;随后上线web端,稳稳占住“去除背景”这一关键词的流量,拓展AI背景(踩坑,参阅之前选题《AIGC风潮下修图App出路在哪?PhotoRoom示范如何月流水大涨破千万》)、AI阴影等相关功能;在GPT-image-1出来后,又最快与OpenAI联合研发、迅速上线AI模特图、产品美化器、场景设计图等功能;近期又开始布局“批量生成适配不同平台素材”的功能。
而Pixelcut作为更晚入局、却在近一年时间斩获最多新增流量的产品(web端新增流量1000w+,差不多是Photoroom新增访问量的2倍),则完全奉行了差异化原则,让其在用户获取上更有发挥空间。
AI做商品图,大概遵循上传产品实拍图->去背景->加背景、阴影等->导出高清图片(甚至有的用户要求能达到打印标准)的路径,因而大部分有做商品图需求的用户去搜索的关键词,首先就是#去除背景,然后这条路径上还能产出的关键词包括#图片变清晰,以及#AI背景(因为技术限制落地水平、流量最弱)。
Top关键词、及关键词的平均点击量,以及主要流量的网站|图片来源:白鲸出海根据SimilarWeb数据绘制
这3个功能点的相关关键词、其对应的规模,以及2个头部产品在其中的占位,能够很好地反映出Pixelcut为什么能后来居上。
虽然#去除背景 关键词流量规模最大(Top10关键词有7个为去除背景及其各种变体)、且Photoroom其实占到了绝大部分流量(参见下图),但Pixelcut依然能在这种围困中,拿到最大流量关键词#background remover的Top3流向网站,而Photoroom并不在其中。在流量稍次一级的#图片增强 的关键词中,Pixelcut更是能稳定获取相关流量。
为同类网站带来最多点击量的Top10关键词,有7个与背景相关,3个与图片变清晰相关,对应使用流程的2个非AI生成环节|图片来源:Similarweb
这背后是Pixelcut针对Photoroom产品的2点差异化努力。
(1)在#background remover这一关键词上,Pxielcut的承接页面的设计,使其相较于Photoroom额外出现在了相关问题、和图片搜索的结果页面中;在页面细节之外,Pixelcut在去掉背景的体验上做了更多优化。
2个产品提供的去除背景的体验流程都很流畅,也都能无限制导出非高清图片。但相较于以去除背景见长的Photoroom,Pixelcut提供了更优质的体验。
除了背景去除+纯色背景之外,Pixelcut在加背景这一环节还另外提供了#图片背景、#生成背景 2个选项。图片背景可以在不登录状态下尝试,而生成背景则要登录(以弹窗形式登录),无需离开承接页面
登录后,生成页面也是按类别提供了非常多的选项。例如在下图中,笔者上传T恤,产品提供了极简工作室和流行的街头风格等多种AI背景选项。而当我上传耳机,它又会根据品类推送极简科技工作室、木质桌面等AI背景选项。
2款产品主要用于承接#backgroundremover 关键词流量的子功能页面 | Photoroom(上)&Pixelcut(下)
笔者测试的过程中,会尝试更多不同背景,很容易就拉长停留时长;而图片处理结果虽然有瑕疵、但整体效果还可以,基本能满足用户的基础需求,而无需再跳出寻找其他替代产品。
这样的SEO操作,毫无疑问有利于优化Google搜索引擎排序算法中#用户停留时长和 #last click 这2个核心指标。(注:谷歌排序算法中,有2个关键维度,#用户停留时长、#Last Click,第2个不好理解,其实是评估当前页面是否能满足用户完整的搜索意图,而不再去查看其他搜索结果。)
2款产品都可导出非高清图片 | Photoroom(左)&pixelcut(右)
(2)而在图片增强的关键词上,Pixelcut也主要打在了Photoroom的软肋上。
为同类网站带来最多点击量的Top10关键词,有7个与背景相关,3个与图片变清晰相关,对应使用流程的2个非AI生成环节|图片来源:Similarweb
图片增强,除了是AI做商品图流程中的一个关键节点,也真的是Photoroom的弱点。首先,我们在web端并没有找到相关功能。而在App端,虽然放大增强被作为Pro会员功能被列示在编辑工具中,但最终生产的图片清晰度,是不少用户的吐槽点。(我们对Photoroom近一年移动应用商店的评论做了分析,我们用#resolution、#image quality、#low quality、#low res、#blur等5个词做搜索,得到多条与分辨率相关的差评)
SimilarWeb显示,在与Pixelcut的关键词竞争中,Photoroom失败的关键词主要集中在#图片增强 和一些例如删掉图片文字的长尾词上。而在流量获取之外,Pixelcut相对Photoroom也呈现出更开放式的设计(集成各家模型供用户选择vs.Photoroom的“模型隐藏”)、更便宜的价格等差异点,并在用户心智上,放大Photoroom踩坑的AI背景,Reddit上多名用户对Pixelcut的认知是,图片背景的模板更多样、AI背景更厉害(2025年7月份Photoroom才把之前踩坑的AI背景功能做了大升级)。
在分析了Pixelcut网页和SEO策略后,我们认为其之所以能在竞争的激烈中快速增长,主要原因有以下几点:
1. 使用流程上可提取的关键词(例如去除背景、高清图片)流量规模最大,但占住该关键词有窗口期;面对对手多个页面围追堵截,可以选择火力主攻1个页面,提高其搜索权重以获得流量。
Photoroom用多个功能子页面和不同语言页面承接#去除背景的流量,而pixelcut将流量主要集中在1个页面,并多采用弹窗不跳转拉长时长、提高权重
2. 错过窗口期后,观察竞争对手的劣势功能、用户吐槽点,可在功能差异化层面进行优化,SEO上同时发力;(例如,放大图片清晰vs竞对图片质量降级;主攻AI背景和图片背景多样性vs竞对AI背景踩坑)
3. SEO的努力方向与产品本身/优势功能契合,才能真正锁住流量,SEO的精髓,要回归用户体验。insMind的“失败”,刚好是太过于流量导向而又缺少关键差异点来确保留存。
“现在的创业,时机非常重要,在合适的时间点去发布一款产品,然后不断去强化自己的竞争力,如果错过那个时间点,你又没有差异化,根本不能可能做过别人。”曾做出过2款访问量几百万的AI web的创业者如是说。
也许在AI商品图这个赛道,很难再出现出海企业后来居上的景象。“我们不觉得在这个时间段,与Photoroom竞争AI商品图,还有什么意义。”面对整个AI商品图的竞争格局,一位从业者这样告诉白鲸出海。
这种流量的两极分化,不仅仅体现在腰尾部初创产品上,几个大厂近期上线的产品也难逃趋势。
快手的AI商品图产品poify上线3个月,现在流量不到1w;阿里的Pic Copilot 5月份流量25w左右,2个月前还有50w左右。
背后的原因除了工具类产品对大厂吸引力不足、投入有限之外,其实也有AI商品图/模特图面临的另一个问题,即更倾向于“讨好”消费者的电商平台方,面对AI生成的商品图可谓左右为难,典型例子就是淘宝上半年整治AI假图,虽说AI商品图不等于假图,但这也表明AI参与到电商行业后,已经引发了一些问题,现阶段的技术能解决的问题依然有限,难以真正有效地大商用范围。
综合起来,就有了创业者们感受到的“太卷”——随着AI技术迭代,头部企业努力优化产品来扩充用户盘子,但实际落地效果短期内难有飞跃,形成增量有限的局面;与此同时,赛道参与者众多,给流量获取带了更大的难度。
二、Kontext来了,机会来了?
从流量回归产品,我们在调研这类产品的时候,会发现在商品图的美好宣传与使用者的实际体验之间,始终隔着一道沟壑。
“抠图放在纯色或者简单背景里,其实已经差不多能够落地。但如果放到一些复杂好看的背景里,如果仅用AI工具,产品几乎都会变。”在一家出行产品品牌做商品图的贾浩表示。“商品图第一要真实,第二才是好看,产品变了就失去了意义。老板们看了AI产品的宣传,感觉立省几十万,但实际上之前作图的流程,都不能省。
复杂的产品,我们会训练LoRA,但出图有时候还是会变。后来,有些情况下我们就让AI出图,然后把产品去掉,剩下AI发挥创意做出的背景图,再用PS把产品和背景融合在一起。其中消耗的时间也不少。”
去掉背景之后的耳机原图
测试的3个AI背景里,后2张图都出现了与原产品的不一致,主要集中在头梁和耳罩之间的连接结构 | 测试产品_Pixelcut
对于当初更多出海企业押注的AI模特图赛道,服装的一致性则更难以保证。
“听话等于服装细节不变,包括纹理、材质、面料、版型都不能变化,而且加了一些光影进来也不能变,而客户要求的结果是听话+AI model做出指定Pose+优秀摄影师作品的质感。”
很多创企已经转型但一直坚持做AI模特图(AI商拍)的WeShop的GM吴海波告诉我们,“AI是自由的,客户要的是‘听话’。当你想让自由的AI去对齐客户想要的‘听话’,生成的质量就会变差,甚至产品和衣服变形。当时AIGC火了之后,电商这个事情,大家想的都很大,国内的图片量又很大,这是当时很多创企都切到模特图的一个原因,但是做着做着就会发现技术很难实现预期结果,很多人就不做了。”
吴海波告诉我们,对于AI商拍(AI模特图),其实难点也是一样。第一步请模特、第二步找场景,两者结合形成氛围感。WeShop其实是在服饰保持和场景生成中间,做一个平衡。而事实上,对于图的要求,国内会比海外更高,这也是海外的增速会更快一些的原因。他认为,现象背后主要是2点:
1. 国内在AI商拍上,供应端更卷一些。
从淘宝和SHEIN的图就能看出来,都比海外本地平台拍摄上传的电商图片要更复杂。这背后是国内的商家和品牌从下游或者拍摄公司拿到一张实拍图的成本不高。海外的拍摄成本更高,所以模特图和商品图都会选择更简单干净的背景。因而单纯的AI工具,其实很难能够满足国内商家的要求。
2. 海外有一类场景是一些KOL会发一些东西,他们更追求自然、对细节的要求会弱一些。
现阶段,在用户需求中做平衡,给出尽可能可以落地的方案,是AI商品图和模特图努力的方向。“2025年之后,这也是我们跟竞品之间的一个最大区别,人和背景放在一起。因为大家做款会参考最近流行的打卡地点、拍照姿势,我们做的就是让产品和背景更好地结合在一起。”吴海波表示。
但是当我们拿着最近被各路自媒体猛吹一致性的Kontext问吴海波,是否可能解决AI商品图,甚至AI模特图一致性的难题,带来“翻身机会”的时候,吴海波认为,Kontext无疑是对行业的利好,但并不是他期望中的理想架构,用于解决之前存在的一些问题,还需要大家努力做很多适配工作。
直接在Krea平台使用Kontext模型(非comfyUI的工作流),耳机的材质颜色和模型都发生了变化
基于Kontext模型的ComfyUI工作流,给实拍的耳机加背景,一致性得到了比较不错的保障
人台图
AI模特图 | 某产品A
AI模特图 | Photoroom平台的Virtual Model功能
AI模特图 | WeShop
AI模特图 | Liblib认证创作者Li鱼服装生成模特kontext工作流
面对Kontext工作流实现得还不错的效果,吴海波表示,“就我们自己的训练来看,Kontext去做一个工作流或者showcase还是挺好的,但是还没有变成一个成功率大于某一个数值的输出,这样就不会形成客户去购买算力稳定使用,简而言之,就是不能商用。工作流用户分2种,偏技术类的专家和尝鲜用户,前者能够在工作流报错的时候自己解决,而工作流报错是大概率事件,后者本来对图片的要求也不高。”
(ps:后续我们用服装平面图测试同一个kontext穿衣工作流,出现了衣服直接覆盖在人身上等意外情况)
但对于我们的商业用户来说,他每天是有必须要完成的图片处理量。以我们目前的情况来看,如果抽卡成功率在20%~30%,用Kontext可能会降到5%。
BFL团队(kontext模型厂商)还意在将天花板拉高,他们并不care这个模型被什么人用于什么领域。而我们做AI商拍,虽然在海外某些场景有一些取舍,但一致性依然是最重要的,Kontext在语言信息的处理上、也就是指令听从还是比较差的,它还不是我期望架构的“完全体”,这个模型的技术思想还是偏传统的,我们希望看到一个开源版本的GPT-4o的架构。
但是,在Kontext发布之前会有一些难题需要复杂解法,Kontext出来后,可以做到用比较简单的方案就能解决问题。例如我们之前有一个改变角度来展示服装的功能#change pose,其实技术思路和Kontext有类似之处,因为有一些技术积累,当Kontext出现之后我们能很快应用起来,解决方案会变得更简单一些。
WeShop的操作界面及change pose功能
面对最近又有不少创企尝试进入这一赛道,吴海波认为,做应用层的公司,最重要的就是怎样将行业know-how做成一个控制模块加入进去。有没有know-how非常重要。实际上,整个行业确实在快速增长,但依然很小。加入竞争要思考自己的优势是什么才能活下来。
吴海波解释:“以WeShop为例,ARR每年翻一番、增速很快,但还是一个小事情。技术选型,3—6个月技术必革新,所以AI时代,用户会特别喜新厌旧、到处迁移,ARR没有意义。
或者打一个比喻,淘宝上自己有货、能投得了直通车、一年的收入能维持一个小团队,在这个标准之上的品牌和卖家对AI商拍图,现在是不满意的。他们是现在的这部分需求其实是被“人力密集型”团队承接掉的,说是用AI,但其实用的是AI+人工,我们的目标是做纯AI工具去服务这批人,但现在行业技术还没有达到那条线。”
参考文章:
1.《被卖家追着跑,这一波AI商拍真香了?》,白鲸出海
2.《AIGC风潮下修图App出路在哪?PhotoRoom示范如何月流水大涨破千万》,白鲸出海
3.《谷歌SEO新卷王Pollo.ai,让我放弃研究Canva和Wondershare》,侃侃而亮
4.《OpenAI复制吉卜力,大模型正在吞噬一切产品》,晚点LatePost
数据来自SimilarWeb、点点数据、Semrush、广大大等三方平台,可能与真实数据中存在一定误差,仅供参考。
本文来自微信公众号:白鲸出海 (ID:baijingapp),作者:殷观晓,编辑:智婷