尤洋想知道,梁文锋的目标到底是什么。
文|《中国企业家》记者 闫俊文
编辑|张晓迪
头图来源|受访者
DeepSeek成了热门概念,握住它,仿佛就掌握了财富之门的密钥。
腾讯、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬,得益于DeepSeek概念,腾讯股价一度涨超6%,达到506港元,创下近三年的新高。另一些服务器和初创公司也借此造势,或出售一体机,或售卖token,发了一笔热财。
一时间,追随者如过江之鲫,DeepSeek成了“宽门”,人人都希望通过它来掘金。但偏偏有人例外,要过“窄门”,不跟着DeepSeek的节奏走。
3月1日,一家名为潞晨科技的AI Infra初创公司发布公告,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”这个公告距离它在2月4日上线这项业务还不足一个月。
快速接入,而后快速停止,根源是售卖DeepSeek等开源模型API token的MaaS业务模式带来了亏损。
2月9日,潞晨科技创始人尤洋在微博上“掰指头”算账,阿里云、百度云、腾讯云等内卷低价或免费提供服务,满血版的DeepSeek-R1每百万token官方也只能收到16元,如果满血版的DeepSeek-R1每日输出1000亿token,每月收入约为4500万元,但每月的机器成本是4.5亿元,亏损4亿元!用户越多,亏损越多,尤洋得出结论,MaaS(Model as a Service)在中国短时间内可能是最差的商业模式。
这种观点引发了热议。在知乎上,尤洋给出自己的算账过程,但一部分网友认为他将问题无限拔高,直言其否定了DeepSeek。
3月1日中午,DeepSeek在知乎发表的一篇名为《DeepSeek-V3/R1推理系统概览》的文章提到,理论上一天的总收入为56万美元,成本利润率 545%。
但尤洋仍坚持自己的观点,并列举了三大理由:1.测试速度和实际场景的差距;2.机器利用率峰值和波谷的巨大差距;3.机器的不稳定性。他感叹,有点不太想深入讨论,因为很多人甚至想当然地把“DeepSeek不亏钱”当成一种不能撼动的真理。
3月1日下午,潞晨科技宣布暂停DeepSeek API服务。
3月底和4月底,《中国企业家》两次采访尤洋。他是一位90后,戴着眼镜,身材瘦削,不善言谈,与他在网络上“火力全出”的形象截然不同。
事实上,尤洋要穿过三重“窄门”,一个是大家都在拥抱售卖DeepSeek等开源模型的API服务,但尤洋拒绝;另一个则是他坚定选择与华为昇腾等国产算力厂商合作,大部分人还在等待美国政府对英伟达H20芯片的宽限令;最后,他押注视频大模型,这与文本模型的热闹形成了反差。
“视频大模型是AI时代的相机。”尤洋说,潞晨开源的视频模型Open-Sora 2.0,近期荣登GitHub Trending全球开源热度榜单第一,以此为基础的AI视频生成平台Video Ocean,仅需用户提供一句话描述,即可在线生成高质量动态视频,发布后登上Product Hunt全球产品热度榜单第一。
尤洋履历颇丰,本科毕业后,他先在清华大学攻读硕士研究生,后赴美国加州大学伯克利分校深造,获得博士学位后,任新加坡国立大学高性能人工智能实验室主任、校长青年教授;2021年,尤洋受投资人邀请,在北京创立了潞晨科技,迄今已获得创新工场、真格基金、红杉中国、蓝驰创投、北京市AI产业投资基金等投资机构的数轮融资。
来源:受访者
目前,潞晨科技在北京和新加坡等地有近80人的团队,根据2024年披露的数据,该公司合同营收7700万元人民币,账面上有能满足30个月开支的现金流。
以下是对话的内容实录(有删减):
《中国企业家》:你们在2月和3月遭遇的网络风波,现在已经过去了吗?
尤洋:对我们来说,其实一直没有什么影响,我个人也没有去与DeepSeek对立的想法。
《中国企业家》:现在外界对技术与商业模式的讨论,各种各样的说法都有。
尤洋:在知乎上或者其他地方攻击我的那些人,我敢负责任地说,这些人里99%从来没有用300多张卡去真正部署过DeepSeek,甚至没用100张卡部署过。仅去跟风想象一件事情,和实际动手验证,得到的观察是截然不同的。
我确实亲手验证过这件事情,如果是业界专家看,我的观点跟DeepSeek发布的数据,是没有任何冲突的。
《中国企业家》:但DeepSeek说自己的成本利润率是545%,而你在微博上说MaaS模式下,毛利率是-700%。
尤洋:首先,DeepSeek原文中说了,这是理论数字。没有考虑用户的体验和商业服务的可用性保障,并且他把那些APP以及网页和MaaS上的token都加在一起计算了收入,但显然很多是大家可以免费使用的。
春节的时候,我感觉DeepSeek的热度有点过于疯狂了。它还在非理性市场,一旦变得市场化,需求侧变得不稳定和高要求,那么它的测算还会有非常大的波动。
《中国企业家》:您微博上所说的数据,比方说收入4500万元,机器成本3.6亿元,毛利率-700%,这个结论是你们自己跑出来的?
尤洋:根据微博上另一位博主在AMD机器上的实测换算得到。补充一个例子,Hugging Face中国区的一位资深专家在朋友圈发图,他把卡的性能发挥到极致,烧了一下午的token,也没有烧够100万个,当然他用的卡可能是低配版。考虑到服务全国用户,可能全国有5000万人在用,大多数人每天可能就用一两个小时。但因为我们不能准确预测哪些用户要用多少,什么时候用,同时为了容纳高峰保障MaaS服务的商业稳定,机器要能容纳最高峰,低谷还是得放着,成本还是高峰那么多。
我的算力不管是租还是自建,算力成本都是随时间稳定产生的,推理与训练需求的服务器也不一样,这得放多少服务器,可能需要数万台H20等推理服务器时刻运转。比如大家不能接受微信在高峰时段不可用和三天两头崩掉。类似的,作为MaaS供应商,下游商业应用和C端用户也需要有体验和服务的可用性保障。
《中国企业家》:速度是指token的输出速度吗?
尤洋:赚还是亏,核心的指标就是一台GPU每秒能出多少token,以及对应的成本。比如它究竟是一秒钟输出了1000个token还是10000个token,因为它最终是按照token的价格去卖的。
来源:AI生成
《中国企业家》:公司在2月初上线了DeepSeek的API服务,但经过一个月的尝试,决定不做这个业务,这是为什么?
尤洋:如果不尝试的话,我感觉没有发言权的。其他初创公司可能会觉得,前几个月我烧一下,然后过几个月再坚持一下,跑不通了,我再把它砍掉,但是我们可能就直接过了不到一个月的时间就把它砍掉了。
《中国企业家》:为什么决断这么迅速?
尤洋:有两个原因,第一,我们海外的潞晨云业务增长比较快,我们应该把资金投入到非常难得的增长机会里;第二,MaaS的商业模式还不太成熟就已陷入内卷,现在中国至少有50个云厂商都在提供开源的DeepSeek模型API服务,它已经不是一个稀缺的东西了,现在部署起来也比较成熟,利润空间非常有限。
根据IDC数据,TOP3公有云已占据MaaS 85%市场份额,截至2024年底,MaaS全国用量10000亿token/天。以较贵的DeepSeek-V3刊例价计算,该业务全国全年市场总计营收期望值为:10000亿token/天×8元/百万token×365天=29.2亿元。但实际上,为抢占市场,有大量免费和低价token,不计成本恶性竞争,远达不到上述营收期望。
《中国企业家》:公司公告里也说了“暂停”,你也说MaaS暂时是中国最差的商业模式,什么时候会再次尝试?
尤洋:我们非常灵活,只要它符合市场,并且能产生一定的利润,不管用何种方式,只要它能产生健康的利润,我觉得应该去做。
《中国企业家》:初创公司很少提利润,一般都是先做规模,扩大市场份额。
尤洋:可能不一定公司需要盈利,但是至少这个生意逻辑应该是跑得通的,我的单位经济模型到底是什么?长期来看,它如何产生价值,我觉得产生利润就是一个企业应该追求的东西。
《中国企业家》:作为一个创业者,你怎么看Kimi和DeepSeek这样的明星公司?
尤洋:我感觉都有点可遇而不可求。根据杨植麟的自述,在2023年但凡晚个几周,他可能就达不到他今天的壮举,他的融资窗口只有一个月,当然,他本身也有张予彤(前金沙江创投主管合伙人)的加持,这种机会难得,可遇而不可求,DeepSeek背后的幻方量化资金非常雄厚,较早就有万卡集群了。
这两者的情况其实不像是创业,他们本身就已经家大业大了,更像在运营一个阿里或者谷歌的研发中心,而不是一般创业者的模式。
《中国企业家》:MaaS模式之下,就没有获益的公司?
尤洋:MaaS对OpenAI来说是一个很好的商业模式。我始终觉得AI最终应该形成两三家企业,两三家有绝对实力的企业进行必然(适度)的垄断,而不是一家。比如中国有三家,这三家的模型非常好,它可以像OpenAI那样去闭源,做成MaaS并获得合理收益。
现在MaaS商业模式之所以不好,是因为大都使用开源模型或者没有拉开差距的闭源模型,各家没有本质不同,为了抢占市场,只能打价格战和免费恶性竞争,但成本是根据GPU固定产生的。
《中国企业家》:你在微博上引用红杉资本合伙人周逵的话,寻找“难而正确的事”并沉下心来去做,什么是正确的事?
尤洋:但凡是高价值的东西,肯定会有很多人想去做。因为它有高价值,肯定也不会那么简单,首先每个人都选一个自己相信的点,比如我相信未来就是算力平台,加上视频大模型,这两个生意是有光明前景的。
《中国企业家》:潞晨的商业模式是什么?
尤洋:第一,帮助企业去做自己的AI大模型,比如企业自有模型、行业模型,我们面向一些中小型客户以及传统客户,在海外就是潞晨云,国内就是一体机,这是我们一直在做的事情;第二,我们最近特别关注视频大模型,视频大模型未来就是AI的相机。
《中国企业家》:视频大模型为什么是未来的机会?
尤洋:视频大模型是未来三年少有的持续增长的市场,关键是视频大模型它有两点,第一,它对算力的需求优化极高,一个很小的视频可能都有几百万token,视频大模型未来的三五年核心就是算力优化,这是最重要的事情。
来源:AI生成
第二,视频大模型产品形态很有可能会变成一个算力优化的工作,它跟大语言模型的核心区别是,大语言模型是需要实时交互的,比如说我用ChatGPT或者DeepSeek,如果我问它一个问题,它过两三分钟才回复,甚至超过20秒回复,我就没有耐心了。
但视频大模型我提交一个任务,比如,我让它生成一个电影,生成一个短视频,我是可以等的。
《中国企业家》:视频模型的生意本质还是MaaS模式。
尤洋:对,但它的MaaS商业上比较友好,即便用户同时挤过来,可以队列式处理请求。
《中国企业家》:在云上,训练一个中小企业自己专属的模型的话,大概成本是多少钱?
尤洋:大概是3万元/月,当然有的可能需求高一点也可以,也有些企业花了几百万。在海外,我们大概每月有100万美元的收入。
《中国企业家》:有厂商已经把一体机的价格卖到了14万元左右,你们的一体机价格在数百万元,差别是什么?
尤洋:如果只是买10万元的一体机的话,它跑DeepSeek-R1-671B参数效率不是最高的,也不会有太好的实际意义。其实他们很多是套壳KTransformers这个开源项目。简单做个性价比核算:硬件10万元,Q4量化(一种压缩模型的技术)的残血DeepSeek-R1/V3模型输出能力10token/s,只能供1个用户使用,每月满载理论输出能力26M token;而从云厂买等量未阉割满血模型的API token价值一两百块,还有免费额度和按量折扣。100多万元的一体机可以服务高精度高并发的商业需求和简单私有模型微调开发,显然实用很多。
我们还做了Colossal-AI开源,这是全亚洲最大的大模型训练推理的平台系统,仅就开发工具而言,我们在优化方面积累还是非常深的,收获了5个世界500强客户。
《中国企业家》:现在你们焦虑吗?毕竟H20受限了。
尤洋:还好,国内没有H20的话,我们就做国产芯片,华为昇腾等国产算力发展得很快。
《中国企业家》:我看到国外媒体说华为要发新的芯片910C,你们会觉得有差别吗?会对你们的成本结构有什么影响?
尤洋:差别不大,我们就是想选一个市场上能买到的最好和最受欢迎的机器,基于它去做优化。其实我觉得对我们是更有利的。因为假定国产芯片可能暂时落后英伟达芯片的话,我们其实有更多优化空间可以做。
《中国企业家》:你在微博上也说,华为的芯片优化不可能靠1~2家小公司搞定。
尤洋:华为有几千人的团队与芯片业务相关,华为的芯片肯定是有中流砥柱的作用。我觉得再配合几十家、上百家公司去协同华为生态,这样比较靠谱,肯定不能靠一两家小公司去把这个事情做好。
《中国企业家》:目前,国产芯片相较于英伟达芯片,主要差距在哪里?
尤洋:一张英伟达芯片卖多少钱,一张国产芯片卖多少钱,受限于生产芯片的成本和暂时的技术限制,所以(国内)生产同样性能的芯片成本就高很多,导致必须得这样定价,定价又导致研发速度跟不上英伟达。
来源:AI生成
比如说同样花了1万块钱,英伟达能每分钟出10万个token,国产芯片只能出3万或者2万个token。我觉得华为等已经做得很好了,只不过英伟达积累的时间更长,做了20多年了,饭得一口一口吃。
《中国企业家》:在国产芯片上做优化和加速的难点是什么?
尤洋:大模型层,首先DeepSeek的难点是,国产芯片没那么稳定,它的周边配套也不是特别好,国产芯片很多算子缺失,精度、编译器、集群等又经常出bug,导致使用它开发比较困难,总体上,肯定不是一个芯片本身跑分高低的问题。
这相当于我有一个赛车,它的设计理论速度,比如说250公里每小时,但是我可能要精心尝试跑100次才能跑出一个这样的速度,它还没那么稳定。
《中国企业家》:对于AI Infra企业来说,是模型进化更重要还是加速更重要?
尤洋:其实两者并不矛盾,模型的进化能带动需求的旺盛,进一步带动对开发、应用模型的信心和投入,提升对训推加速、算力的需求,进而加速模型进化。
《中国企业家》:如果你有机会去见到DeepSeek的梁文锋,你会和他讨论什么问题?
尤洋:其实我最关心的是,他到底是想做一个成功的商业化公司,还是想通过一些其他手段做一些非盈利的事情?想知道一下,他的目标到底是什么,因为两者肯定差距是非常大的。比如说OpenAI可能还是想做一个Google那样非常高价值的商业化公司,我不知道梁文锋是不是想做中国AI版的谷歌。
上一篇:海南发展:控股股东优化免税资产注入承诺,海南自贸港全岛封关前夕谋划弯道超车 海南发展股票注入免税资产 海南发展海南国资重组资产注入
下一篇:四川省联社旧将突然被查,退休后研究川茶文化、被指格外低调 四川省联社旧将突然被查,退休后研究川茶文化、被指格外低调