
阶跃星辰创始人、CEO姜大昕
DeepSeek热潮下,“大模型六虎”们逐步开始“分化”,更多转向产业界和落地商业化阶段。
钛媒体AGI 2月21日消息,今天举行的首届Step UP生态开放日上,AI“大模型六虎”之一的阶跃星辰公布开源大模型、Agent智能体进展和全新的开源推理和视频推理模型等。
阶跃星辰创始人、CEO姜大昕在演讲中表示,公司朝着实现AGI的目标稳步前进,目前已进入Agent(智能体)的发展阶段。他指出,智能体的发展依赖于两大关键要素:一是多模态能力,让智能体充分地感知和理解世界;二是推理能力,使智能体能够进行长思维链的慢思考,主动规划、尝试、反思,通过不断纠错提供准确的答案。
同时,姜大昕透露,今年3月,阶跃星辰将开源新的图生视频模型。此外,阶跃星辰还发布全新升级的“繁星计划”2.0,其中包括与国有企业上海仪电、上海国有资本投资有限公司、徐汇资本等筹集一个阶跃星辰生态基金,但未透露具体金额,但该项计划旨在为Agent应用开发者提供模型、算力、资本、数据和企业孵化等全方位支持,并将联合模速空间为优质创业项目提供办公场地支持,在上海打造大模型产业聚集效应。

据悉,阶跃星辰成立于2023年4月,由微软前全球副总裁姜大昕创办,ResNet作者之一的AI科学家张祥雨、拥有丰富大规模集群与系统建设经验的AI系统专家朱亦博等都先后加入阶跃星辰,主要瞄准AGI。
2024年12月,阶跃星辰宣布完成B轮融资,总融资金额达数亿美元,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
过去一年,阶跃星辰共发布11款多模态大模型,覆盖语音识别、语音生成、多模态理解、图像及视频生成的全面能力。今年1月,阶跃星辰发布了 Step R-mini,成为Step系列的首款推理模型,进一步拓展了大模型的能力边界。
阶跃星辰近期持续发力开源,已陆续开源两款模型——300亿参数的图生视频模型Step-Video-T2V,以及1300亿参数的语音模型Step-Audio。此外,就在2月18日,阶跃星辰与清华大学联合开源了大规模强化学习RL的推理模型Open-Reasoner-Zero,拥有7B、32B版本。其中,32B版表现优于DeepSeek-R1-Zero-Qwen-32B,训练步骤减少到原有1/30,效率提升了25倍。
对于开源的原因,姜大昕表示,在DeepSeek感召下,阶跃星辰在多模态领域有个深厚的积累,也创建了强大的模型,开发者也热切的盼望在多模态领域是否也能够出现非常强大的多模态模型,因此,阶跃星辰选择在近期发布开源多模态模型技术。
“多模理解持续领先,多模推理率先探索。”显然,从训练转移到推理,多模态会成为主流的需求。
姜大昕还透露了阶跃星辰未来两个重点关注的方向:多模态推理以及Agent智能体技术,以实现阶跃星辰AGI的技术路线“单模态—多模态—多模理解和生成的统一—世界模型—AGI”。
其中,在多模态推理,阶跃星辰正在进行“视觉推理模型”研发,他提到,这一模型能够实现视觉空间下的慢思考。
“模拟世界这个阶段,训练模型的主要范式是模仿学习,而学习的主要目标是各种模态的表征,包括从声音、文本、图像、视频一直到4D时空的物理世界。对于复杂问题的求解,人脑是启动了一套‘第二系统’,或者就是说慢思考的能力。在每个步骤,如果我们发现开始的思路不对,可能还会重新设想我们的思路,不断探索,直到解决成功为止。”姜大昕称。
Agent层面,阶跃星辰将智能终端Agent视为大模型技术落地的核心突破点,在姜大昕看来,影响Agent的两个关键因素,多模态和慢思考在2024年都有了显著的进展。因此,阶跃星辰重点布局垂类Agent(企业和开发者)、智能终端Agent(汽车、手机、具身智能、IoT)智能体落地,包括与吉利汽车集团、千里科技、OPPO、智元机器人、TCL等企业展开合作,共同打造垂直场景下的创新C端应用体验。

“那么所谓主动就是Agent,能够主动的观察用户所处周围的环境,或者说他周围的context是主动的发起或者完成任务,而不是仅仅被动的接受任务。大家要想能够自主完成复杂任务,这个目标还需要一些辅助的功能。”姜大昕表示,随着底座大模型能力的不断增强,Agent能力还会不断进化,会经历五个阶段。最终,Level 5从智商上升到了情商。
此外,值得一提的是,“AI四小龙”(商汤、旷视、依图、云从)之一的旷视科技联合创始人印奇,带着新身份“千里科技董事长”,与吉利汽车集团副总裁、吉利汽车研究院院长李传海,一同出现在生态日圆桌论坛上。

这是印奇首次亮相。
据悉,2月18日,力帆科技正式更名为千里科技(SH:601777,前称为力帆股份),而蜕变升级而来的全新品牌将聚焦“AI+车”的核心战略,以科技创新为核心竞争力,创新产业发展模式,全面增进自动驾驶、智能座舱等领域的研发实力。而印奇是千里科技的股东、公司董事长,吉利产投也是千里科技股东之一。
AI一日,世上一年,现在千里,一日千里。印奇表示,目前最成功的AI产品,仍然是特斯拉和抖音,不过,大模型也将给应用带来更大的市场空间。
钛媒体AGI整理了印奇首次亮相的现场提到的重要信息:
此次开放日上,吉利汽车集团、千里科技和阶跃星辰联合宣布,将进一步加强三方现有技术合作伙伴关系,推动“AI+车”的深度融合。
“我觉得,聊天机器人现在和人类连接还是非常肤浅的,因为聊天机器人只能通过聊天内容来知道用户情况,而人类是可以陪伴在用户的左右,Agent产品需要真正的做到感同身受,从而提供情绪价值。”姜大昕在演讲结尾表示。
(本文首发于钛媒体App,作者|林志佳)
