“狠人”闫俊杰,闯关IPO 狠人出场dj 狠人合集马东锡
创始人
2025-07-11 13:22:23



“MiniMax在探索一条之前没有被验证过的路。”

文|《中国企业家》记者孔月昕

编辑|马吉英

头图来源|受访者

6月17日,在MiniMax官方公众号发布了全球首个开源大规模混合架构推理模型MiniMax-M1后,公司创始人闫俊杰随即转发到朋友圈,并配文称:“第一次感觉到大山不是不能翻越。”

之所以这么说,是因为M1模型通过以闪电注意力机制为主的混合架构和更快的强化学习算法CISPO(一种强化学习算法,通过裁剪重要性采样权重提升强化学习效率)两项技术突破,实现了深度推理的显著高效,并提升了强化学习的效率。据公司介绍,整个强化学习阶段只用了512块H800三周的时间,换算成(算力)租赁成本为53.47万美元。

除了M1外,在之后的4个工作日里,MiniMax又连续发布了Hailuo 02视频生成模型、MiniMax Agent通用智能体、Hailuo Video Agent视频创作智能体、Voice Design音色设计。在MiniMax Agent发布当天,闫俊杰的朋友圈配文是:“研发中越来越强烈的感受是AI的价值可以开始被经济来衡量。”

与此同时,MiniMax在资本市场也有新消息传出。6月,公司被爆出正考虑在港股IPO的消息。


来源:受访者

这一消息并非空穴来风:早在2024年,MiniMax旗下产品星野AI(Talkie)的营收已突破千万美元,在海外市场表现尤其出色,下载量曾超越CharacterAI,成为美国AI应用Top4。财务实力的支撑更为关键——知情人士透露,公司今年以来通过多轮未公开融资,积累了充足的现金储备(约十几亿美元)。近期还完成了Pre-IPO融资,使其成为大模型创业公司中资金最雄厚的玩家。

截至发稿,对于资本市场相关进展,公司方面并未正面回应。

充足的现金储备让闫俊杰具备了高度的战略自主权,也让这位“赌性”很重的创业者,能坚定推行“加速技术迭代”的发展路径。明势创投合伙人夏令此前参加活动时,曾评价MiniMax是“一家兼具野心、资源实力与非共识坚持的公司”,明势创投创始合伙人黄明明则称,“闫俊杰是一个‘狠人’,在资源等方方面面有限的情况下,他还是专注在模型研发上。只有这样的企业家可能才能走得更远,走到终局。”

锚定MoE架构破局

2021年12月,商汤上市前夕,作为副总裁、研究院副院长和智慧城市事业群CTO的闫俊杰,选择离开商汤。

在闫俊杰看来,2020年之前,AlphaGo做过很多东西,整个社会对人工智能的关注度和期待值都非常高,且国内外都投入了大量的研发资金,但当时的人工智能只能做一些非常简单的事,比如人脸识别、语音识别等,创造的社会价值比较低。

对于当时的闫俊杰来说,这是一件“很痛苦的事”,他逐渐意识到,核心因素在于当时的人工智能不够通用。


来源:AI生成

“当时我们用虚拟模型解决客户的问题,一旦客户有无数个问题,就得做无数个模型,即每做一个模型就要训练一次,还要导数据,整个生产链条非常慢。因此我们只能服务一些大客户,因为企业需要定制,但定制的成本周期很长,商业模式也变成了定制模型。”闫俊杰回忆。

他在思考的是,“如果不做定制模型,把模型做得通用,是不是就可以服务普通人了?”

同时,闫俊杰恰好看到了OpenAI关于GPT-3的论文,并受到启发,“把(GPT)模型放大10倍,技术路线就可能成立了。”

不过,做通用的工具和闫俊杰在商汤的研发路线完全不一样,需要的人才、组织结构也不一样,闫俊杰由此发现,“这应该是一家新兴公司的机会。”2022年初,MiniMax正式成立。

云启资本是MiniMax早期投资方之一,合伙人陈昱最初跟闫俊杰接触时,就发现闫俊杰是一位野心比较大的创业者,“他想做中国的OpenAI或DeepMind,最终实现通用人工智能”。

在技术路线的选择上,闫俊杰也非常大胆。

2023年下半年,大部分中国同行还在继续迭代稠密模型(dense model),它能更稳健地提升大模型性能。闫俊杰则几乎把全部研发和算力资源都投到了一件更不确定的事情上——MoE(混合专家系统)模型。

黄明明回忆,彼时,MoE在硅谷都不是主流共识,只有OpenAI在做,甚至MoE的提出者,都没有把MoE这条路坚持走下去。

在闫俊杰看来,尽管OpenAI尚未公开GPT-5,但其内部已完成了该模型的训练。GPT-5的训练需要高达5万张卡的算力,短期内,国内难以达到3万张卡的规模,因此若要实现与GPT-5相当的效果,必须采用更高效的算法(MoE),否则就永远追不上(OpenAI)。因此,MoE也成了团队“一定要做的事情”。

2023年夏天,闫俊杰带领MiniMax团队开始专注研发MoE。

黄明明认为,闫俊杰看上去是一个很温和的人,实际上他很疯狂。在认定终极目标后,他会把所有资源all in,去赌这个事情。

“他把当时手头80%的算力资源都用来推MoE。”黄明明说,“前两次是失败的,直到第三次成了,他才跑过来跟我们(投资人)讲,MoE差不多能搞定了。”

黄明明问闫俊杰:“为什么你要赌这么大?你赌不出来,可能这家公司就挂了。”

闫俊杰的回复是,“只有我把MoE做出来,才能用更低的成本向更高的模型阶段去演进,否则用的是一个不可估量的成本去往下一步,没有一家公司能支持这样token的消耗量去往更高的平台进化。”

应对DeepSeek,慢了一步

2025年1月15日,MiniMax发布了首个开源模型MiniMax-01系列。

在接受晚点采访时,闫俊杰指出,开源的核心价值在于加速技术进化。“更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。”闫俊杰说。想清楚“智能水平的提升,没那么依赖用户规模”后,闫俊杰做出了取舍,他认为现在MiniMax最重要的目标不是增长,也不是收入,是“加速技术迭代”,并坚定了要做一家技术驱动型公司的念头,开始有意识地打造技术品牌。

但从行业变化看,闫俊杰还是“慢”了一步。2024年12月26日,DeepSeek-V3发布后,在业内形成一定的口碑和品牌效应。2025年1月20日,DeepSeek-R1发布,在大众层面掀起的声量迅速盖过了相对低调的MiniMax,进一步抢夺了C端用户的心智。

面对汹涌而来的DeepSeek冲击波,国内模型厂商主要分成了两队,一队是积极拥抱,大力宣传旗下产品接入DeepSeek;另一队是坚决不接入DeepSeek,并死磕自研自己的推理模型。

MiniMax的选择是,在国内C端应用上坚持不接入DeepSeek,只在海外的AI应用上选择接入DeepSeek。

同时,据MiniMax内部员工透露,DeepSeek发布并没有影响他们研发团队的节奏,内部还是保持原有计划,专注且低调地进行技术研发。


来源:视觉中国

黄明明也表示,他们非常认可MiniMax持续专注在底层模型的研发上。“好的应用或好的产品,都是模型能力自然而然的体现,模型能力强了,一定会做出好的产品。事实证明,当模型能力不够强时,做出的产品就需要很多缝缝补补,打很多补丁,耗费巨大的人力和物力,并丧失你在底层模型上的专注度。”黄明明说。

6月中旬,MiniMax连续发布了包括基础模型及应用在内的5款产品,业内对于其模型和应用的产品评价比较正面,Hugging Face工程师王铁震告诉《中国企业家》:“MiniMax在探索一条之前没有被验证过的路,非常有价值。”

(注:Hugging Face是一家成立于2016年的美国人工智能公司,致力于构建开源的机器学习社区和平台,提供丰富的预训练模型、数据集和工具,帮助开发者更便捷地构建、训练和部署AI应用。)

不过,MiniMax-M1系列模型并未引发大范围轰动。截至7月10日,其在Hugging Face最热帖下载量仅25.2K,GitHub最热帖收藏量仅3K——这一数据明显低于Google、Meta今年初发布的开源模型,也逊色于DeepSeek-R1的收藏及下载量。

部分Agent创业者反馈,虽注意到MiniMax M1模型的发布,但因自身产品上线排期紧张,暂未及时投入测试。另一位AI领域创业者告诉《中国企业家》,当前海外AI领域热点频发(如GPT-5发布在即,Meta新模型迭代),分散了行业注意力,客观上削弱了M1的传播声量。在他看来,国际模型技术仍具备一定领先优势。

对此,一位MiniMax投资人表示,MiniMax一贯的风格是相对低调和克制,它最后交付的产品口碑,可能比大家记住模型名字或下载量更重要。

“你只有最后交付一个产品,才容易做商业化,才有可能达到上市的体量。快手的可灵交付的也是一个生产工具,大家看重的也是产品,而非快手的视频模型。”该投资人补充道。

相关内容

热门资讯

新闻发布 | 2025年上半年... 2025年上半年全市经济社会运行情况新闻发布会 发布时间:2025年8月6日下午 ∆ 新闻发布会现...
纳指收涨1.21% 苹果领涨大...   中新经纬8月7日电 美股三大股指周三集体收涨,纳指涨超1%。  Wind截图  美东时间8月6日...
联检科技:拟收购深圳中认通测检... 每经AI快讯,联检科技(SZ 301115,收盘价:16.35元)8月6日晚间发布公告称,联检(江苏...
原创 帮... 油价蔫了、铜价疯了、金价稳了——这仨兄弟分道扬镳的背后,是政策、供应与资金在暗地里掰手腕! 各位老铁...
安克创新、自然堂高管坐阵,寻找... 头图 | AI生成作者 | 大鲸助理AIGC技术、AI助手、营销大模型等概念持续火热的2025年,“...
万亿线缆行业破“内卷” 跳出价... 大订单对线缆企业的综合实力提出更高要求。 受访公司/供图 证券时报记者 陈澄 电线电缆被喻为国民经...
北京楼市:卖房人开始后悔! 老... 最近不少卖房业主的心态都发生了变化,后悔上半年没有卖掉房子,并且最近几个月价格俯冲的速度超预期。 还...
国产CAR-T涌向实体瘤:管线... 本文来自微信公众号:和观医疗,作者:和光观察,原文标题:《创新药洞察(三):CAR-T 企业研发管线...
中国东航跌0.26%,成交额1... 来源:新浪证券-红岸工作室 8月6日,中国东航跌0.26%,成交额1.52亿元,换手率0.23%,总...
京东扁平化管理挑战:5层架构如... 京东集团近期在内部进行了一场引人注目的组织架构调整,这一变革由集团董事局主席刘强东亲自推动。在6月的...
“不创新”的老年科技公司,如何... 本文来自微信公众号:艾年,作者:齐妍妍,原文标题:《老年科技「反内卷」:融资2.3亿、拿下千家社区、...
三年赚了70多亿,腾子的二游还... 稳中求胜,锦上添花。 文/以撒&梁乐天 夏日档作为二游的「春节档」,向来竞争非常激烈。而在今年的夏日...
嘉化能源上半年营收利润双增,女... 报告显示,嘉化能源公司上半年营业收入为50.06亿元,同比增长8.31%;归母净利润为5.81亿元,...
壹览独家丨与淘宝闪购并列,飞猪... 出品/壹览商业 作者/李彦 编辑/木鱼 8月6日,壹览商业独家获悉,飞猪已被提升为淘宝一级入口,与今...
日本工资数据:6月名义增2.5... 【日本工人名义工资增速加快,引发央行加息猜测】8月6日数据显示,日本工人名义工资以四个月来最快速度增...
超百亿元资金流向港股ETF 近期,港股情绪冲高后有所回落,大量资金借道ETF涌入港股市场。Choice数据统计显示,截至8月5日...
三年前“一查就撤”,诚丰新材重... 导读:被抽中现场检查后马上选择“逃单”,这不得不让人怀疑该拟上市企业对自身“合规”的不自信。当然,如...
“能源航母”重构版图!中国神华... 本报(chinatimes.net.cn)记者刘昱汝 徐芸茜 北京报道在能源领域,一场规模空前的整合...
携程、同程、抖音、美团、飞猪,... 据贵州省市场监督管理局(贵州省知识产权局)价监反垄断处发布的消息, 8月5日,贵州省市场监督管理局集...
原创 加... 据报道,前不久,加拿大财政部突然宣布将对自美国以外国家进口的含有在中国熔化和浇铸钢铁的产品征收25%...
连平:民营经济高质量发展将带来... 来源:意见领袖 意见领袖 | 连平、刘涛、王运金 民营经济是我国社会主义市场经济的重要组成部分。加快...
海信“80后”女掌门首个半年考... 区间跌幅6.62%、市值蒸发近25亿元——这是海信家电中报发布后的五个交易日内,资本市场给出的直观反...
1瓶88元,名叫“牛市”,港股... 红星资本局8月6日消息,港股白酒第一股珍酒李渡(06979.HK)开始卖啤酒了。“没错,就是你所理解...
豆神教育8月5日融资净偿还96... 来源:雷达财经 雷达财经雷助吧出品 文|肖文竹 编|深海 东财Choice金融数据显示,2025年...
持续加大研发投入 中触媒上半年... 上证报中国证券网讯(记者 韩远飞)8月6日晚,中触媒发布2025年半年报,上半年公司实现营业收入4....
“白酒教父”吴向东要做啤酒,珍... 出品|达摩财经8月6日,珍酒李渡(6979.HK)股价低开高走。截至收盘,公司股价收于7.38港元/...
宁德时代与海辰储能之战幕后:不... 在锂电池领域拥有绝对优势的宁德时代,除了比亚迪之外,似乎就没有一个能打的对手。这个行业的游戏规则和商...
银行险企中罕见保费下滑,招商信... 出品|达摩财经随着二季度偿付能力报告的逐渐落地,上半年非上市银行险企的经营全貌也跟着清晰起来。今年上...
诺和诺德回应市场份额下滑,中国... 8月6日,诺和诺德公布最新季度财报。财报显示该公司第二季度增长不及市场预期,在包括美国在内的关键市场...
爱奇艺寻求香港二次上市融资3亿... 8月6日,有消息称,爱奇艺很可能在今年寻求在香港上市,并融资3亿美元。有知情人士表示,爱奇艺已经开始...