本文来自微信公众号:正和岛 (ID:zhenghedao),作者:豆汁儿,原文标题:《214亿!这位90后AI天才,太炸》
如果要问谁是“中国大模型90后第一人”,你会想到谁?
很多人第一反应是DeepSeek的创始人梁文锋。尽管DeepSeek今年初才横空出世,梁文锋仅用半年就登上创富榜前十,但他其实是1985年出生,属于“85后”。
图片来源:《新财富》杂志
而真正属于“90后”的这一位,是月之暗面的创始人——杨植麟。他以93.9亿元的身家,首次进入创富榜,排名第366位。
杨植麟1992年出生,比梁文锋还小7岁。那时候,新希望的刘永好靠卖饲料已成千万富翁。
而杨植麟这位曾备受资本青睐的AI天才,在2023年3月创立月之暗面时,可谓风头无两。单轮融资就超过10亿美元,打破国内AI大模型单轮融资的最高纪录。他推出的AI助手“Kimi”一度在热度上超越微信,让很多大厂都感到了压力。
到2024年5月,月之暗面估值已达30亿美元(约214亿人民币),杨植麟也被誉为“中国大模型90后第一人”。
然而好景不长。DeepSeek的突然崛起,改变了行业格局,不少同行措手不及。月之暗面也一度陷入沉寂:暂停广告投放、几乎没有公开动态、消息寥寥。
直到今年7月11日晚,在毫无预告的情况下,月之暗面发布了新一代大模型——Kimi K2,犹如深水炸弹,瞬间引爆中外AI圈。
不到24小时,Kimi K2就席卷各大科技榜单。
英国《自然》杂志还专门刊文报道,称“世界迎来又一个DeepSeek时刻”。
那个久未露面的AI天才,终于回来了。
“不想当鼓手的文青不是好学霸”
杨植麟从小就是学霸,但不是书呆子。
他热爱摇滚、电影和旅行,最爱的乐队是平克·弗洛伊德(Pink Floyd)——英国传奇摇滚乐队,人送外号“英国迷幻摇滚祖师爷”。
年少时的杨植麟,梦想是成为摇滚明星或流浪诗人。
在清华期间,他创立了Splay摇滚乐队,担任鼓手和词曲创作,还在校园歌手大赛中拿过前三。
他虽然成绩好,却不是传统意义上的“应试学霸”。
或许得益于开放的家庭氛围,他从小性格自由,整天想着玩摇滚、写诗,颇具“中二”气质。父母也并没有给他太大成绩压力,该学就学、该玩就玩。
没有心理包袱的他,轻松考上了当地最好的高中——汕头金山中学。
高中时,他原本没有编程基础,却误打误撞进了信息学竞赛培训。仅训练一年,就拿下了全国青少年信息学联赛广东一等奖,拿到了清华的保送资格。
之后他又参加了清华的自主招生考试,再次被录取。高三时,已经保送的他还是参加了高考,结果以667分成为汕头理科状元——第三次被清华录取。
嗯,怎么说,三过清华门口而不入(保安不让)的笔者,看到他的故事多少有点释怀了:进清华是种缘分,或许我与清华的缘分还未到。(doge)
但这还不是最让人破防的:杨植麟虽然三次考进了清华,但他还打得了一手好鼓呀!
高中和大学时期,他迷上了摇滚乐。
在清华,他花很多时间组建Splay乐队——乐队名字来源于一种数据结构“Splay Tree”。
杨植麟解释说:当时觉得现实中有很多压力和荒诞,组乐队成了我们表达的途径。
他甚至写过一首关于“一夜暴富白日梦”的歌:调侃当下许多人追求“阶级跨越”的现象,提醒自己不要变得过于功利。
“我人生中最好的时代”
提起杨植麟,不止是本系,其它院系的师生对他也并不陌生。
原因无他:学术成绩实在太优秀了。
起初杨植麟并不在计算机系,大二时,杨植麟做了一个重要决定:转入计算机系。
起因,是读了村上春树的《城市及其无定墙》。书中程序员深夜写代码的场景,让他特别着迷。别的没记住,就光想着“我也要成为那样的人”。
转系后,他师从中国AI领军人物唐杰教授。
他说:“计算机是最厉害的专业,人工智能是当下最活跃的领域,写代码好像能改变世界。”
尽管是“半路出家”,但脑子好使外加勤奋与真的感兴趣,本科四年,杨植麟始终立于年级第一的不败之地,10门专业课满分,所有专业课成绩90分以上。
发表论文二十多篇,其中十余篇为第一作者,还拿下了Nvidia先锋研究奖、Facebook ParlAI研究奖等荣誉。
什么概念?这么说吧,笔者直到研究生毕业,也不过才发表了论文一两篇,没有对比就没有伤害。
在高手云集的清华,不焦虑是假的,但杨植麟有自己的应对方式:不求广,而求深。
“在这里,你很容易遇到在某个方面比你更强的人,天天被碾压。所以我告诉自己,要找准一个方向做深度探索,追求极致,才有可能成为最强的人。”
2014年,他以14票中13票的绝对优势,拿下清华大学特等奖学金。在答辩演讲里,他慷慨激昂:
“这是计算机科学最好的时代,因为这是数据的时代;这也是我人生中最好的时代,因为我怀揣梦想,做最好的事情,让数据改变世界。”
去美国,拜大神
2015年3月,《“互联网+”行动指导意见》出台,人工智能被写进能形成新产业模式的重点领域发展目标任务。同年7月,北京召开“2015中国人工智能大会”,《中国人工智能白皮书》发表。
人工智能开始被纳入国家战略。
也就在这一年,杨植麟离开清华,起身奔赴大洋彼岸,去往美国卡内基梅隆大学攻读博士学位。
在那里,他遇到了两位顶级大佬,苹果AI负责人Ruslan Salakhutdinov和谷歌首席科学家William Cohen,并把精力收敛到对大语言模型的研究上。
博士期间,他不仅和图灵奖得主、深度学习三巨头之一Yoshua Bengio合作发布“火锅问答”数据集HotpotQA,还以第一作者身份发表了两篇里程碑式的论文:Transformer-XL(突破固定上下文长度的语言模型)、XLNet(提出广义自回归预训练框架)。
这两篇论文在AI领域影响巨大,引用量超过22000次。杨植麟也因此成为中国35岁以下NLP领域引用最高的研究者,其成果被Google PaLM、Meta LLaMA等主流产品采用,成为他进入AI2.0时代的重要“船票”。
2022年,OpenAI推出ChatGPT,AGI(通用人工智能)技术给整个世界带来了震颤。
一直在创业公司“循环智能”工作的杨植麟,终于坐不住了。
“有点激动,有点焦虑,有点FOMO(害怕错过),但又非常兴奋。”2023年4月,拿到1亿美元融资后的他,迅速创立北京月之暗面科技有限公司(Moonshot AI),全力进军AGI(通用人工智能)领域。
“中国版ChatGPT”
月之暗面这个名字,来源于平克·弗洛伊德的经典专辑《The Dark Side of the Moon》。
月球背面一直吸引人类的好奇——它并不是黑暗,只因永远背对我们,所以引人无限遐想。
如AGI探索之路,漫长而引人入胜。
作为学术背景与大模型高度契合的创始人,杨植麟很快成为AI圈的红人。
公司创立初期就获得红杉中国、真格基金等投资,融资2亿美元。2024年2月,再获超10亿美元融资,创下行业纪录。
2023年10月,月之暗面推出AI助手Kimi,支持20万字长文本输入,对话容量全球第一——当时OpenAI的GPT-4仅支持2.5万字。
凭借出色的长文本处理能力,Kimi迅速脱颖而出。
2024年3月,Kimi再次突破,将上下文窗口扩展至200万字,遥遥领先同行。
从学术到创业,杨植麟把Kimi打造成了国内AI聊天机器人的佼佼者,月访问量超2000万。
月之暗面也一跃成为科技圈的“当红炸子鸡”,美团、阿里、腾讯、小红书等纷纷投资,公司估值一路涨到33亿美元。
但杨植麟没想到,短短几个月后,一个广东老乡的出现,会让他真正坠入“月之暗面”。
DeepSeek一拳打懵
今年年初,DeepSeek横空出世,彻底改变了国内AI“六小龙”的格局,打得同行措手不及。字节、阿里等巨头也纷纷入场。
红极一时的月之暗面,迅速黯淡。
Kimi的市场占有率开始下滑,To C投放全面暂停,关键成员离职,月活跃用户数下降,公司甚至陷入舆论风波。
此后,杨植麟几乎不再公开露面。
公司内部,员工难以察觉他的情绪波动,只发现,他把飞书名后缀加上了“时间的朋友”。
除了外部竞争,公司内部也面临挑战。
去年4月,有媒体曝出他在月之暗面融资后套现数千万美元,尽管公司否认,但还是影响了公众信任。
同时,他与前公司“循环智能”的投资方之间发生股权纠纷。争议焦点是:月之暗面是否用了前公司的资源?纠纷甚至走到了仲裁阶段。
这一切,都让初创阶段的月之暗面雪上加霜。
在技术还没形成护城河之前,杨植麟曾把大量精力放在投流上。2024年3月至8月,Kimi广告投放高达1.4亿元,单月最高投了近5000万。
效果确实有——半年内,Kimi月活从400万涨到1282万,稳居行业第二,仅次于百度文心一言。
但大规模投流不只是为了抢市场。杨植麟说,更重要的是获取数据、扩大样本,怎么筛选和运用数据,才决定AI能长成什么样。
可惜的是,尽管用户量上来了,Kimi产品形态却没有重大迭代,只是小修小补。团队规模始终控制在200人以内,技术更新速度明显落后于动辄几千人的大厂。
更致命的是,2024年下半年,多名算法工程师离职。杨植麟解释说不是人才流失,而是主动做“业务减法”,不希望团队太大影响创新。
但市场结果说明了一切。在今年1月20日,DeepSeek R1和Kimi1.5同一天发布,反响却天差地别。
DeepSeek R1震惊全球,完全盖过了Kimi的风头。
小步慢跑的Kimi,输给了憋出大招的DeepSeek。
从技术角度看,杨植麟似乎陷入了一个误区:他一直坚信“Scaling Law”是模型训练的第一性原理,但DeepSeek R1的成功证明,这条路不是唯一的。
图灵奖得主杨立昆评价说,DeepSeek在突破性创新上并不突出,但在低成本、开源、多任务推理上表现非常出色。
由于不开源、更注重通用推理和多模态,Kimi在特定推理任务上不如DeepSeek,模型性能被单模态的DeepSeek R1全面超越。
很多人都说,大模型“六小龙”的时代,结束了。
DeepSeek上线一个月,下载量破亿。梁文锋的技术路线证明了一点:靠投流抢用户,对模型能力提升帮助不大。
梁文锋也是广东人,常在公开场合被塑造成“技术理想派”,但他其实非常务实。他通过压缩成本、开源引流、生态协同,快速构建商业闭环,在金融、游戏等领域落地规模极大。
投资人朱啸虎曾说,“AI创业者要勇于承认自己没有壁垒”,又补充说“但你可以更懂用户、更懂产品,在非AI的地方建立壁垒。”
怎么看杨智麟团队?
“他人是很厉害的,大模型确实比较适合他。他做科研是可以的,但我不知道他怎么商业化。王小川也一样的。”
“月之暗面在国内大模型是领先,但长远还是要证明自己能追上美国开源。如果能超过开源,那这个团队就真有价值了。”
K2出山,再登顶
很多媒体说,DeepSeek这一击,“彻底打醒了杨植麟”。
怎么突围?月之暗面选择切入垂直赛道。
公司大幅收缩投放预算,暂停安卓渠道和第三方广告合作。
虽然短暂迷茫,但杨植麟很快清醒过来:模型比拼的下半场,是技术生态和应用场景。投流是大厂的舒适区,而对创业公司来说,技术才是根本。
月之暗面把“持续拿到SOTA结果”定为最重要目标,市场策略上更专注垂直领域。
2025年4月,Kimi与财新传媒合作,在财经类问答中引入专业内容,获得大量财经媒体关注。近期,Kimi还布局AI医疗,加强医学专业搜索质量。
今年3月至6月,月之暗面团队几乎从公众视野消失,全力打磨基础模型。
经过四个月的闭关,2025年7月11日,月之暗面毫无预警地开源发布Kimi K2——全球首个万亿参数、320亿激活的MoE模型。
技术圈先是一片沉默,随后炸开。开源不到24小时,GitStar数破1.8万,MLX社区发布了4bit量化版。有东京的开发者用K2-Base复现了Claude-3.5的代码能力。
在LMSYS的匿名评测中,K2-Instruct冲上总榜第四,仅次于GPT-4o、Claude-3.5和Gemini-1.5-Pro,把DeepSeek-R1挤到了第五。
K2从DeepSeek手中夺回“全球开源第一”的宝座,硅谷的开发者也都在热议Kimi。英国《自然》杂志称,K2的发布让世界迎来“又一个DeepSeek时刻”。
随着越来越多开发者试用,K2的好评还在增加。Perplexity的CEO Aravind也在多个场合公开称赞K2。
沉寂太久的杨植麟,终于重新坐上了牌桌。
“攀登无尽的山”
在过去一年的起伏中,杨植麟反复读一本书——英国物理学家David Deutsch的《The Beginning of Infinity》(无穷的开始)。
书中两句话影响了他:“问题是不可避免的”“问题是可以解决的”。
在他看来,人类文明就是不断解决问题、拓展知识边界的过程。
旧问题解决,新问题又来——研究的空间不断开阔,知识没有尽头。
“这正是最有意思的地方:你总有新问题要解决,每解决一个,技术就爬上几百米。也许有一天你会发现,这座雪山没有尽头——我希望它一直没有尽头。”
在接受媒体人张小珺采访时,他说:“AGI不是终点,而是你一直在向上攀登的过程。”
他将K2比作“乔戈里峰”——不是最高,但却是最难爬的山。
她问他:“如果技术之路如同无尽雪山,你追求的是什么?”
他答:“就是攀登本身。原来在山底下,现在又往上提升了一点,能看到的景色不一样。”
摇滚、电影与AI:一群人的“味道对了”
杨植麟说,摇滚和创业很像,都代表反叛和打破常规。
招聘时,他有时会问对方最喜欢的专辑是什么。“答案能让我快速判断,他是不是和Kimi有共同的审美和价值观。”
月之暗面的团队极具特色:他们热爱摇滚、电影,崇尚自由与创造。
团队成员Crystal曾在社媒发文说:“我们是一群喜欢摇滚和电影的科学家。我加入的一个重要原因就是觉得味道很对味。”
这种品味渗透在公司每个角落:会议室用传奇乐队命名,比如The Rolling Stones、Queen、Bowie;公司里放着电吉他和钢琴;产品细节和UI设计也藏着同样的审美。
杨植麟的微信签名来自一句歌词:“I'm a million different people from one day to the next”(每天我都像是换了个人)。出自Bitter Sweet Symphony。
摇滚如何塑造一个人?
或许是:遵从内心,反抗世俗的标准;既是芸芸众生中的一个,也是自由独特的那一个。
为了更好地了解这位AI天才,笔者重新续上了某音乐App的黑胶VIP,点开《The Dark Side Of The Moon》,一首接一首往下听。
《DARK SIDE OF MOON》专辑封面
《Speak To Me》的前奏扑面而来,是那种带着紧张感的未来之音——《银翼杀手》式的科幻氛围。飞机掠过的机械声由远及近,又渐行渐远,夹杂着女声的英语播报、男人的笑声,最后一切在远雷声中渐隐,由强到弱,归于岑寂。
摇滚究竟是什么?是反抗,是实验,是对世界的诘问与呐喊,是内心压抑的彻底宣泄,是哪怕渺小也要冲破苍穹的赤子之心——“我与我周旋久,宁做我”。
这些感受,如五雷轰顶般侵入耳膜,在沉闷中撕开了一道凛冽的口子。
整张专辑里有很多类似的瞬间,写实、艰深而隐晦、充满强烈个性。融合迷幻与太空摇滚,哲学意味浓厚,虽不那么大众,却探索着前卫摇滚的未来。
紧接着,《Time》的前奏响起。七秒之后,闹钟、校钟、铃铛与嘀嗒声交错,背景中隐约可辨微弱却紧绷的心跳。突然,一记重音砸下——似钢琴又如电吉他——其他乐器悄然跟进,层层铺开。一个,两个,五个……直到两分十八秒,人声终于进场:
“为了打发无聊的一天,你随意地浪费时间,漫无目的地在家乡闲逛,空等别人告诉你方向……突然有一天,发现十年已过去。没人告诉你何时起跑,你早已错过了发令枪……”
对时间流逝的哀叹,却不带逃避,反而有种自责的愤懑和语重心长的温柔。
马克·吐温说:“每个人都是月亮,都有不曾展露的暗面。”
那杨植麟的“暗面”是什么?这张专辑或许提供了一个线索。
月之暗面,已无暗面
杨植麟是90后科技创业者的一个典型代表:他们成长于安定富足、技术触手可及的时代,自带理想主义,兼具技术能力与审美品味。
而在四十多年前,科学家创业还是一种奢望。
《激荡三十年》中写,1980年,科学家陈春先在美国硅谷考察后,提出要建“中国硅谷”,并在同年召集了十几个文质彬彬的社科院研究员,创办了第一家民办科研机构“先进技术服务部”,直接催生了后来的中关村。
做科研能成博导的陈春先,创业却一路艰难。当联想等企业从他奠基的中关村腾飞,他仍守着几十平米的小屋子。
而今天,杨植麟从科研转身创业,已不是新鲜事。
摇滚之外,Kimi团队还喜欢昆汀的天马行空和库布里克的冷峻哲学。《2001:太空漫游》中的那块黑色方碑,追问着月之暗面是什么,人类将去向何方。
如杨植麟在朋友圈写下的歌词:“I'm a million different people from one day to the next…”(每一天我都在成为百万个不同的人)。摇滚精神塑造了他——遵从内心、反抗世俗,既普通,又特别。
不难看出,杨植麟喜欢的音乐与电影风格,深层次都是在激发人对自我存在、价值实现、科技与人类命运的思考。
所以也能理解,与一些急于商业化的AI公司不同,强调技术理想主义的他,野心更大。
他曾说:“AI不是一两年就要找到PMF(产品市场匹配),而是未来十到二十年如何改变世界。”
但改变世界需要现实土壤。光靠理想,能支撑他的野心吗?
Kimi K2虽获认可,但就像两年前他迅速走红又迅速陷入低谷一样,能否重回巅峰,还要经过市场考验。
但有一点能肯定:对一路顺风顺水的杨植麟来说,经历这次“月之暗面”,或许反而是种助力——让他获得了某种黑暗生命力。
在他喜欢的月之暗面专辑里,有首歌叫《Brain Damage》,里面唱了一个“行为异常”的人,讽刺所谓的“正常”。清醒的人不被世俗接受,只有“月之暗面”才能容纳他——这也是整张专辑的精神内核。
收官曲《Eclipse》则列尽普通人的经历,最后唱:“Everything under the sun is in tune,but the sun is eclipsed by the moon”——太阳之下万物和谐,但日全食悄然而至。
一种苍凉无奈,油然而生。
这一代年轻人,错过红利期,深陷内卷和经济下行。他们迫切需要一场机遇,一场能突破局限、扭转命运的机遇。
而AI,这场百年一遇的技术浪潮,正悬在他们眼前。
他们成长于新时代,心存理想和热爱,往往在成就自我的同时,也想“改变一下世界”。和上一代创业者不同,他们站在更高起点,想象空间也更大。
无数个“杨植麟”正在摩拳擦掌,准备在AI战场大展身手。
在月亮与六便士之间,杨植麟选择了“月之暗面”。骨子里,他或许还是那个摇滚少年。
他喜欢的专辑中还有一首《Us and Them》,歌词这样写:
“沉沦,或被放逐,都已无法改变。但这其中大有深意——其间其外,谁又敢说,这不是所有奋斗的意义?”
年轻且专注于技术理想,踩着技术爆发迅速成长——他们如何在历史中留下印记?更长的路,才刚刚开始。
而在2024年,嫦娥六号成功登陆月球背面,采样返回地球。人类终于亲手触摸到月之暗面的一部分——月球,对人类而言,早已没有绝对的暗面。
月之暗面,揭开了宇宙暗面的曙光。而人类也将从这里出发,走向更深的宇宙。
参考文献:
[1].《和杨植麟时隔一年的独家对话:“站在无限的开端”》,语言即世界language is world[2].《杨植麟,一个90后理想主义者的掉落》,白鲸实验室
[3].《Dark Side of the Universe|月之暗面》,中国国家天文
[4].《三次考上清华的鼓手,痛击美国AI巨头》,最华人
[5].《杨植麟不认输|AI 50人》,创智记
[6].《杨植麟|学霸养成记:清华毕业,论文20余篇,六个语言建模任务世界纪录,他的故事还在继续》,清华大学计算机校友会