穿过DeepSeek的窄门 穿过DeepSeek的窄门
创始人
2025-05-07 09:36:46



尤洋想知道,梁文锋的目标到底是什么。

文|《中国企业家》记者 闫俊文

编辑|张晓迪

头图来源|受访者

DeepSeek成了热门概念,握住它,仿佛就掌握了财富之门的密钥。

腾讯、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬,得益于DeepSeek概念,腾讯股价一度涨超6%,达到506港元,创下近三年的新高。另一些服务器和初创公司也借此造势,或出售一体机,或售卖token,发了一笔热财。

一时间,追随者如过江之鲫,DeepSeek成了“宽门”,人人都希望通过它来掘金。但偏偏有人例外,要过“窄门”,不跟着DeepSeek的节奏走。

3月1日,一家名为潞晨科技的AI Infra初创公司发布公告,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”这个公告距离它在2月4日上线这项业务还不足一个月。

快速接入,而后快速停止,根源是售卖DeepSeek等开源模型API token的MaaS业务模式带来了亏损。

2月9日,潞晨科技创始人尤洋在微博上“掰指头”算账,阿里云、百度云、腾讯云等内卷低价或免费提供服务,满血版的DeepSeek-R1每百万token官方也只能收到16元,如果满血版的DeepSeek-R1每日输出1000亿token,每月收入约为4500万元,但每月的机器成本是4.5亿元,亏损4亿元!用户越多,亏损越多,尤洋得出结论,MaaS(Model as a Service)在中国短时间内可能是最差的商业模式。

这种观点引发了热议。在知乎上,尤洋给出自己的算账过程,但一部分网友认为他将问题无限拔高,直言其否定了DeepSeek。

3月1日中午,DeepSeek在知乎发表的一篇名为《DeepSeek-V3/R1推理系统概览》的文章提到,理论上一天的总收入为56万美元,成本利润率 545%。

但尤洋仍坚持自己的观点,并列举了三大理由:1.测试速度和实际场景的差距;2.机器利用率峰值和波谷的巨大差距;3.机器的不稳定性。他感叹,有点不太想深入讨论,因为很多人甚至想当然地把“DeepSeek不亏钱”当成一种不能撼动的真理。

3月1日下午,潞晨科技宣布暂停DeepSeek API服务。

3月底和4月底,《中国企业家》两次采访尤洋。他是一位90后,戴着眼镜,身材瘦削,不善言谈,与他在网络上“火力全出”的形象截然不同。

事实上,尤洋要穿过三重“窄门”,一个是大家都在拥抱售卖DeepSeek等开源模型的API服务,但尤洋拒绝;另一个则是他坚定选择与华为昇腾等国产算力厂商合作,大部分人还在等待美国政府对英伟达H20芯片的宽限令;最后,他押注视频大模型,这与文本模型的热闹形成了反差。

“视频大模型是AI时代的相机。”尤洋说,潞晨开源的视频模型Open-Sora 2.0,近期荣登GitHub Trending全球开源热度榜单第一,以此为基础的AI视频生成平台Video Ocean,仅需用户提供一句话描述,即可在线生成高质量动态视频,发布后登上Product Hunt全球产品热度榜单第一。

尤洋履历颇丰,本科毕业后,他先在清华大学攻读硕士研究生,后赴美国加州大学伯克利分校深造,获得博士学位后,任新加坡国立大学高性能人工智能实验室主任、校长青年教授;2021年,尤洋受投资人邀请,在北京创立了潞晨科技,迄今已获得创新工场、真格基金、红杉中国、蓝驰创投、北京市AI产业投资基金等投资机构的数轮融资。


来源:受访者


目前,潞晨科技在北京和新加坡等地有近80人的团队,根据2024年披露的数据,该公司合同营收7700万元人民币,账面上有能满足30个月开支的现金流。

以下是对话的内容实录(有删减):

放弃DeepSeek API服务,最主要原因是亏损

《中国企业家》:你们在2月和3月遭遇的网络风波,现在已经过去了吗?

尤洋:对我们来说,其实一直没有什么影响,我个人也没有去与DeepSeek对立的想法。

《中国企业家》:现在外界对技术与商业模式的讨论,各种各样的说法都有。

尤洋:在知乎上或者其他地方攻击我的那些人,我敢负责任地说,这些人里99%从来没有用300多张卡去真正部署过DeepSeek,甚至没用100张卡部署过。仅去跟风想象一件事情,和实际动手验证,得到的观察是截然不同的。

我确实亲手验证过这件事情,如果是业界专家看,我的观点跟DeepSeek发布的数据,是没有任何冲突的。

《中国企业家》:但DeepSeek说自己的成本利润率是545%,而你在微博上说MaaS模式下,毛利率是-700%。

尤洋:首先,DeepSeek原文中说了,这是理论数字。没有考虑用户的体验和商业服务的可用性保障,并且他把那些APP以及网页和MaaS上的token都加在一起计算了收入,但显然很多是大家可以免费使用的。

春节的时候,我感觉DeepSeek的热度有点过于疯狂了。它还在非理性市场,一旦变得市场化,需求侧变得不稳定和高要求,那么它的测算还会有非常大的波动。

《中国企业家》:您微博上所说的数据,比方说收入4500万元,机器成本3.6亿元,毛利率-700%,这个结论是你们自己跑出来的?

尤洋:根据微博上另一位博主在AMD机器上的实测换算得到。补充一个例子,Hugging Face中国区的一位资深专家在朋友圈发图,他把卡的性能发挥到极致,烧了一下午的token,也没有烧够100万个,当然他用的卡可能是低配版。考虑到服务全国用户,可能全国有5000万人在用,大多数人每天可能就用一两个小时。但因为我们不能准确预测哪些用户要用多少,什么时候用,同时为了容纳高峰保障MaaS服务的商业稳定,机器要能容纳最高峰,低谷还是得放着,成本还是高峰那么多。

我的算力不管是租还是自建,算力成本都是随时间稳定产生的,推理与训练需求的服务器也不一样,这得放多少服务器,可能需要数万台H20等推理服务器时刻运转。比如大家不能接受微信在高峰时段不可用和三天两头崩掉。类似的,作为MaaS供应商,下游商业应用和C端用户也需要有体验和服务的可用性保障。

《中国企业家》:速度是指token的输出速度吗?

尤洋:赚还是亏,核心的指标就是一台GPU每秒能出多少token,以及对应的成本。比如它究竟是一秒钟输出了1000个token还是10000个token,因为它最终是按照token的价格去卖的。


来源:AI生成


《中国企业家》:公司在2月初上线了DeepSeek的API服务,但经过一个月的尝试,决定不做这个业务,这是为什么?

尤洋:如果不尝试的话,我感觉没有发言权的。其他初创公司可能会觉得,前几个月我烧一下,然后过几个月再坚持一下,跑不通了,我再把它砍掉,但是我们可能就直接过了不到一个月的时间就把它砍掉了。

《中国企业家》:为什么决断这么迅速?

尤洋:有两个原因,第一,我们海外的潞晨云业务增长比较快,我们应该把资金投入到非常难得的增长机会里;第二,MaaS的商业模式还不太成熟就已陷入内卷,现在中国至少有50个云厂商都在提供开源的DeepSeek模型API服务,它已经不是一个稀缺的东西了,现在部署起来也比较成熟,利润空间非常有限。

根据IDC数据,TOP3公有云已占据MaaS 85%市场份额,截至2024年底,MaaS全国用量10000亿token/天。以较贵的DeepSeek-V3刊例价计算,该业务全国全年市场总计营收期望值为:10000亿token/天×8元/百万token×365天=29.2亿元。但实际上,为抢占市场,有大量免费和低价token,不计成本恶性竞争,远达不到上述营收期望。

《中国企业家》:公司公告里也说了“暂停”,你也说MaaS暂时是中国最差的商业模式,什么时候会再次尝试?

尤洋:我们非常灵活,只要它符合市场,并且能产生一定的利润,不管用何种方式,只要它能产生健康的利润,我觉得应该去做。

《中国企业家》:初创公司很少提利润,一般都是先做规模,扩大市场份额。

尤洋:可能不一定公司需要盈利,但是至少这个生意逻辑应该是跑得通的,我的单位经济模型到底是什么?长期来看,它如何产生价值,我觉得产生利润就是一个企业应该追求的东西。

《中国企业家》:作为一个创业者,你怎么看Kimi和DeepSeek这样的明星公司?

尤洋:我感觉都有点可遇而不可求。根据杨植麟的自述,在2023年但凡晚个几周,他可能就达不到他今天的壮举,他的融资窗口只有一个月,当然,他本身也有张予彤(前金沙江创投主管合伙人)的加持,这种机会难得,可遇而不可求,DeepSeek背后的幻方量化资金非常雄厚,较早就有万卡集群了。

这两者的情况其实不像是创业,他们本身就已经家大业大了,更像在运营一个阿里或者谷歌的研发中心,而不是一般创业者的模式。

《中国企业家》:MaaS模式之下,就没有获益的公司?

尤洋:MaaS对OpenAI来说是一个很好的商业模式。我始终觉得AI最终应该形成两三家企业,两三家有绝对实力的企业进行必然(适度)的垄断,而不是一家。比如中国有三家,这三家的模型非常好,它可以像OpenAI那样去闭源,做成MaaS并获得合理收益。

现在MaaS商业模式之所以不好,是因为大都使用开源模型或者没有拉开差距的闭源模型,各家没有本质不同,为了抢占市场,只能打价格战和免费恶性竞争,但成本是根据GPU固定产生的。

初创公司的商业模式是什么?

《中国企业家》:你在微博上引用红杉资本合伙人周逵的话,寻找“难而正确的事”并沉下心来去做,什么是正确的事?

尤洋:但凡是高价值的东西,肯定会有很多人想去做。因为它有高价值,肯定也不会那么简单,首先每个人都选一个自己相信的点,比如我相信未来就是算力平台,加上视频大模型,这两个生意是有光明前景的。

《中国企业家》:潞晨的商业模式是什么?

尤洋:第一,帮助企业去做自己的AI大模型,比如企业自有模型、行业模型,我们面向一些中小型客户以及传统客户,在海外就是潞晨云,国内就是一体机,这是我们一直在做的事情;第二,我们最近特别关注视频大模型,视频大模型未来就是AI的相机。

《中国企业家》:视频大模型为什么是未来的机会?

尤洋:视频大模型是未来三年少有的持续增长的市场,关键是视频大模型它有两点,第一,它对算力的需求优化极高,一个很小的视频可能都有几百万token,视频大模型未来的三五年核心就是算力优化,这是最重要的事情。


来源:AI生成


第二,视频大模型产品形态很有可能会变成一个算力优化的工作,它跟大语言模型的核心区别是,大语言模型是需要实时交互的,比如说我用ChatGPT或者DeepSeek,如果我问它一个问题,它过两三分钟才回复,甚至超过20秒回复,我就没有耐心了。

但视频大模型我提交一个任务,比如,我让它生成一个电影,生成一个短视频,我是可以等的。

《中国企业家》:视频模型的生意本质还是MaaS模式。

尤洋:对,但它的MaaS商业上比较友好,即便用户同时挤过来,可以队列式处理请求。

《中国企业家》:在云上,训练一个中小企业自己专属的模型的话,大概成本是多少钱?

尤洋:大概是3万元/月,当然有的可能需求高一点也可以,也有些企业花了几百万。在海外,我们大概每月有100万美元的收入。

《中国企业家》:有厂商已经把一体机的价格卖到了14万元左右,你们的一体机价格在数百万元,差别是什么?

尤洋:如果只是买10万元的一体机的话,它跑DeepSeek-R1-671B参数效率不是最高的,也不会有太好的实际意义。其实他们很多是套壳KTransformers这个开源项目。简单做个性价比核算:硬件10万元,Q4量化(一种压缩模型的技术)的残血DeepSeek-R1/V3模型输出能力10token/s,只能供1个用户使用,每月满载理论输出能力26M token;而从云厂买等量未阉割满血模型的API token价值一两百块,还有免费额度和按量折扣。100多万元的一体机可以服务高精度高并发的商业需求和简单私有模型微调开发,显然实用很多。

我们还做了Colossal-AI开源,这是全亚洲最大的大模型训练推理的平台系统,仅就开发工具而言,我们在优化方面积累还是非常深的,收获了5个世界500强客户。

华为是个大机会

《中国企业家》:现在你们焦虑吗?毕竟H20受限了。

尤洋:还好,国内没有H20的话,我们就做国产芯片,华为昇腾等国产算力发展得很快。

《中国企业家》:我看到国外媒体说华为要发新的芯片910C,你们会觉得有差别吗?会对你们的成本结构有什么影响?

尤洋:差别不大,我们就是想选一个市场上能买到的最好和最受欢迎的机器,基于它去做优化。其实我觉得对我们是更有利的。因为假定国产芯片可能暂时落后英伟达芯片的话,我们其实有更多优化空间可以做。

《中国企业家》:你在微博上也说,华为的芯片优化不可能靠1~2家小公司搞定。

尤洋:华为有几千人的团队与芯片业务相关,华为的芯片肯定是有中流砥柱的作用。我觉得再配合几十家、上百家公司去协同华为生态,这样比较靠谱,肯定不能靠一两家小公司去把这个事情做好。

《中国企业家》:目前,国产芯片相较于英伟达芯片,主要差距在哪里?

尤洋:一张英伟达芯片卖多少钱,一张国产芯片卖多少钱,受限于生产芯片的成本和暂时的技术限制,所以(国内)生产同样性能的芯片成本就高很多,导致必须得这样定价,定价又导致研发速度跟不上英伟达。


来源:AI生成


比如说同样花了1万块钱,英伟达能每分钟出10万个token,国产芯片只能出3万或者2万个token。我觉得华为等已经做得很好了,只不过英伟达积累的时间更长,做了20多年了,饭得一口一口吃。

《中国企业家》:在国产芯片上做优化和加速的难点是什么?

尤洋:大模型层,首先DeepSeek的难点是,国产芯片没那么稳定,它的周边配套也不是特别好,国产芯片很多算子缺失,精度、编译器、集群等又经常出bug,导致使用它开发比较困难,总体上,肯定不是一个芯片本身跑分高低的问题。

这相当于我有一个赛车,它的设计理论速度,比如说250公里每小时,但是我可能要精心尝试跑100次才能跑出一个这样的速度,它还没那么稳定。

《中国企业家》:对于AI Infra企业来说,是模型进化更重要还是加速更重要?

尤洋:其实两者并不矛盾,模型的进化能带动需求的旺盛,进一步带动对开发、应用模型的信心和投入,提升对训推加速、算力的需求,进而加速模型进化。

《中国企业家》:如果你有机会去见到DeepSeek的梁文锋,你会和他讨论什么问题?

尤洋:其实我最关心的是,他到底是想做一个成功的商业化公司,还是想通过一些其他手段做一些非盈利的事情?想知道一下,他的目标到底是什么,因为两者肯定差距是非常大的。比如说OpenAI可能还是想做一个Google那样非常高价值的商业化公司,我不知道梁文锋是不是想做中国AI版的谷歌。

相关内容

热门资讯

极为特殊的时刻,大事密集发生,... 作者|布语 老肥编辑 | 剑书今天,大事密集发生,信号极不寻常。在喜马拉雅山的南面,印巴爆发激烈交火...
基金经理薪酬将与投资者回报强挂... 事关公募基金的重磅改革方案靴子落地!5月7日,《推动公募基金高质量发展行动方案》(以下简称《方案》)...
全球瞩目!凌晨2点,美联储将公... 每经编辑|程鹏 5月8日凌晨,美股三大指数窄幅震荡,谷歌A股价大跌。当前全球市场正在等待美联储的利...
一季度转让规模激增 银行加速处... 本文共1900字 阅读完约4分钟 向纭嬉 金融投资报记者 吉雪娇 近日,银行业信贷资产登记流转中心(...
正荣地产13.2亿债券将于5月... 蓝筹地产 5月6日,正荣地产控股股份有限公司发布公告,披露2021年面向专业投资者公开发行公司债券...
原创 5... 各位老铁,这里是帮主郑重的收评时间。今儿收盘这行情,像极了老茶馆里的说书场——有人拍案叫绝,有人摇头...
冲击500万辆整体销量目标!吉... 本文来源:时代周报 作者:赵昱5月7日,吉利汽车(00175.HK)宣布,计划收购极氪(ZK.NYS...
山西郑氏家族资本腾挪,赫美集团... 出品|达摩财经郑氏家族入主赫美集团(002356.SZ)两年,公司紧锣密鼓入局新能源行业。近日,赫美...
“懒人爬山神器”爆火:外骨骼机... 本文来源:时代周报 作者:朱成呈五一假期,外骨骼机器人以“懒人爬山神器”之名,席卷国内山岳型景区。在...
双星名人集团陷家族内斗风波?员... 双星名人集团或陷入家族内斗。近日,一封署名为双星名人集团总裁汪海于今年4月28日向全体双星鞋服员工发...
美股三大指数小幅高开,现货黄金... 北京时间5月6日晚,美股三大指数小幅高开,道指涨0.35%,纳指涨0.05%,标普500指数涨0.1...
阿里字节,在东南亚悄悄联手了 ... 记者丨江一苇编辑丨谭璐阿里牵手字节跳动,一起做大东南亚电商生意。5月6日,阿里旗下的狮腾控股发布公告...
东吴证券首席经济学家芦哲:我国... 【东吴证券首席经济学家芦哲:我国财政政策仍然有充足的空间】财联社5月7日电,在东吴证券7日举办的经济...
白电巨头强强联合:美的集团与海... 5月7日,南都湾财社记者获悉美的集团与海信集团签订战略合作协议。据悉美的集团与海信集团双方将围绕AI...
三家公司,拟终止上市! 5月7日晚,*ST中程、*ST人乐、*ST恒立宣布收到终止上市事先告知书,或挥别资本市场。 记者注意...
230家上市公司净利增长!A股... 截至目前,A股494家医药生物行业上市公司2024年年度业绩报告均已发布。具体来看,超七成上市公司实...
一揽子金融政策公布!专家解读十... 5月7日上午9时,国新办举行新闻发布会,中国人民银行行长潘功胜、国家金融监管总局局长李云泽、中国证监...
旅游需求增加或将提振航空票价 ... 今年“五一”假期,国内文旅市场持续火爆。据文化和旅游部数据中心测算,假期5天全国国内出游3.14亿人...
车市“五一”放榜!头部阵容不变... “五一”假期结束,车企们的4月销量成绩也陆续出炉。这场“放榜”持续了6天,从5月1日上午9点持续到假...
美年健康:实控人控制企业“代培... 《金证研》南方资本中心 望山DL/作者 西洲 映蔚/风控2025年4月29日,美年大健康产业控股股份...
“银行系AIC”扩容来了,兴业... 来源:密探财经(ID:Spy Finance)刚刚,兴业银行公告了一条重大投资消息。这跟今日下午,国...
年内股价涨幅超三成的百济神州,... 今年以来,百济神州(ONC.NS、06160.HK、688235.SH)美股、港股、A股三地的股价累...
因年龄原因,浦发银行副行长刘以... 新京报贝壳财经讯 5月7日,浦发银行发布公告称,该行于5月6日收到副行长、首席风险官刘以研的辞呈。因...
华夏航空:关于归还用于暂时补充... 证券日报网讯 5月7日晚间,华夏航空发布公告称,公司于2024年8月5日召开第三届董事会第十三次会议...
公司热点|连亏5年后,皓宸医疗... 5月7日晚间,皓宸医疗(深市代码:002622)公告称,公司第一大股东广州汇垠日丰投资合伙企业(有限...
公告精选丨吉利汽车:建议私有化... 今日焦点吉利汽车:建议私有化极氪,每股作价2.57美元吉利汽车公告,公司于2025年5月7日向极氪提...
涉嫌内幕交易!A股百亿市值公司... 5月7日晚间,国内“医美+眼科”双赛道龙头、百亿市值A股公司昊海生科(688366.SH)发布公告称...
贵州百灵年报披露失实 投资者索... 记者 萧峰2024年11月9日贵州百灵企业集团制药股份有限公司(以下简称“贵州百灵”)发布公告称,因...
天使投资人屠铮陪跑泡泡玛特多年... 《科创板日报》5月7日讯(编辑 梁又匀)今日,蜂巧资本在其官方公众号发文表示,由于蜂巧人民币一期基金...
去年销售人员扩招三百余人 今世... 21世纪经济报道记者肖夏 重庆报道随着省内市场逐渐稳固,今世缘要进一步发力省外市场了。5月7日举行的...