“开源模型验货官”Perplexity,给Kimi K2盖了个戳
创始人
2025-07-21 10:43:27

“开源模型验货官”Perplexity 展现出其严谨的态度。它在对 Kimi K2 进行检验后,果断地盖上了一个戳。这一动作意味着 Perplexity 经过细致的评估与验证,确认 Kimi K2 在开源模型的范畴内达到了一定的标准与规范。它仿佛是一位公正的裁判,用自己的专业知识和算法,为 Kimi K2 打上了认可的印记,让人们对 Kimi K2 的开源属性有了更明确的认知,也为开源模型领域的发展增添了一份可靠的保障。


本文来自微信公众号:硅星人Pro (ID:gh_c0bb185caa8d),作者:Yoky


Perplexity每一次纳入新模型,都是很强的信号:这一次,亮的是Kimi K2。


7月13日,Perplexity联合创始人兼CEO Aravind Srinivas在X上发布消息:“Kimi K2的内部评测结果非常惊艳,我们很快会启动post-training。”


Perplexity的站台,让K2在开源社区的热度继续飙升,这种盛况并不陌生——上一次出现类似的轰动效应,正是Perplexity宣布选择纳入DeepSeek-R1的时候。


这背后反映出一个有趣的现象:对于全球开发者来说,Perplexity用不用某个开源模型,实际上已经演变成了一个重要的风向标。它所指向的,不仅仅是技术优劣,更是开源模型能否经受住真实产业环境考验的关键信号。


AI搜索是离“真实世界任务”最近的试炼场,而Perplexity对模型的需求远不止“便宜”这么简单。


Aravind曾在Reddit上解释为什么没有接入GPT-4.5:“GPT-4.5的解码速度只有11个token/秒,相比之下,4o是110个token/秒(快10倍),我们自己的Sonar模型是1200个token/秒(快100倍)。这导致用户体验不佳,因为他们期望快速、准确的答案。”


换句话说,实时响应和低延迟是选型的生死线。Perplexity的峰值请求量可达日常十倍,任何超过两秒的等待都会显著降低用户体验。在vLLM+FP8实测中,K2的MoE架构仅激活32B参数,在相同硬件条件下输出速度比R1快一倍,且单位成本更低,这正是高并发场景下经济与性能的最佳平衡点。


今年4月,Aravind预告了Perplexity的系列新功能,他强调这不是简单的产品改动,而是底层模型的重构:“我们需要重写基础设施才能大规模实现。”


他描述的核心功能是更强大的深度研究代理,能够思考30分钟或更长时间,“包括工具使用、交互式和代码执行功能,就像Manus等最近的原型所展示的那样。”


这本质上是一个纯Agent模式:给定自然语言需求,模型必须自主拆解任务、调用工具、执行代码,最终生成完整报告。这种能力恰好与Kimi K2的“模型即Agent”理念完全对齐——K2不是把Agent能力当作后训练插件,而是在预训练阶段就将原生Agent技能刻入权重。


K2在训练阶段引入了数百万条合成Agent任务,覆盖搜索、浏览器、日历、Python、SQL等17种真实工具调用场景。模型学会在单一会话内连续编排16-20步操作,无需人类编写工作流。官方演示中,K2用16次IPython调用将13万行原始数据完成清洗、建模、绘图并输出交互网页报告,全程零人工干预——这直接对应Perplexity设想的“30分钟自主研究”。


当然,选择开源模型的更深层原因在于完整的控制权。拥有完整权重意味着Perplexity可以任意进行LoRA、RLHF、工具蒸馏,无需担心调用频率、并发上限或隐私合规问题。K2采用MIT改协议,月活低于1亿即可商用,Hugging Face直接提供fp8/fp16全套权重,128K上下文窗口足够一次性处理整份财报。对Perplexity而言,这意味着“模型-索引-工具”三层架构可以完全私有化,不再受任何闭源条款约束。


Perplexity在其发展过程中,逐步从依赖OpenAI的GPT模型转向使用开源模型,并在此基础上进行了自研和微调。


2023年下半年,Perplexity宣布推出两款新的“pplx-7b-online”和“pplx-70b-online”,分别基于开源模型Mistral-7b和LLaMA 2-70b构建。“我们从LLaMA-2发布之日起就开始使用开源模型,”Aravind Srinivas说道。


从模型特点来看,Mistral-7B以轻量化和高速度成为早期尝试,验证了小模型在特定任务的可行性;Llama-2-70B提供了更广的知识覆盖面;随后,Perplexity还采用了Code Llama-34B,补强了代码相关的垂直能力。


真正的转折点出现在2025年2月,DeepSeek-R1让Perplexity完成了从“使用开源模型”到“基于开源模型自研”的关键跳跃,获得了完整的权重控制能力。而后,Perplexity又继续深度调优Sonar模型,展现了自研能力的成熟,专门针对搜索问答场景进行优化。


如今选择Kimi K2,正是这一战略的最新体现——不仅在速度和成本上优于R1,其原生Agent能力更完美契合了“30分钟自主研究”的产品需求。


综合来看,Perplexity的模型选型必须在高性价比与高性能之间找到平衡,同时满足特定的产品需求。由于目前尚无开源模型能完全达到其标准,Perplexity只能阶段性地选择最优解,这种“择优而用”的策略反而让其成为了开源模型能力评判的重要风向标。

相关内容

热门资讯

国联景惠混合A:2025年第二... AI基金国联景惠混合A(013190)披露2025年二季报,第二季度基金利润141.77万元,加权平...
京东连投三家头部机器人企业!首... 7月21日,京东完成三家具身智能领域头部企业的投资。千寻智能完成6亿元PreA+轮融资,由京东领投。...
东山精密:7月18日融资买入5... 证券之星消息,7月18日,东山精密(002384)融资买入5.98亿元,融资偿还9.56亿元,融资净...
原创 事... 据环球网援引韩联社报道,面对特朗普政府要求高达25%的全面汽车进口关税威胁,韩国外长提名人赵显紧急表...
继阿里之后,逐际动力再获京东新... 当具身智能的赛道日趋拥挤,竞争的焦点正从卷技术参数,悄然转向真实应用场景的争夺。 7月21日,南都湾...
最强赛道,呈两极分化!有的猛增... 创新药赛道行情爆火的同时,医药基金的“留人能力”却呈现两极分化。券商中国记者注意到,根据最新披露的基...
一线访谈丨我为父母找工作 一线... ‍‍作者|雨谷声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。晃动的地铁车厢里,研...
乐摩物联港股上市招股书失效 乐... 新京报贝壳财经讯 7月21日,据港交所信息显示,福建乐摩物联科技股份有限公司(简称“乐摩物联”)于2...
港股IP经济概念股持续下挫,巨... 7月21日,港股IP经济概念股午后持续下挫,巨星传奇跌超20%,阅文集团跌超6%。
继华为任正非后,《人民日报》头... 在价格战的喧嚣、技术路线的摇摆、全球化的迷雾中,魏建军的每一次选择都像一面旗帜,为长城汽车标定方向,...
“屎到临头不要怂”,美团卖水文... 01.丹麦珠宝潘多拉或将退出中国市场02.美团高管公开喊话阿里京东别卷了03.铂爵旅拍被传“跑路”官...
投资1.2万亿,全球最大水电站... 7月19日,雅鲁藏布江下游水电工程开工仪式在西藏自治区林芝市举行。工程总投资约1.2万亿元,计划建设...
现货黄金表现清淡持,稳于周五涨... 周一(7月21日)亚盘时段,现货黄金表现清淡持稳于周五涨幅后波动,目前暂交投于3354美元附近。国际...
太辰光:7月18日融券卖出71... 证券之星消息,7月18日,太辰光(300570)融资买入2.02亿元,融资偿还2.24亿元,融资净卖...
邹万红履新复星保德信人寿副总、... 机构之家注意到,复星保德信人寿保险有限公司(以下简称“复星保德信人寿”)高管团队迎来关键调整。截至7...
山西焦煤:7月18日融券卖出3... 证券之星消息,7月18日,山西焦煤(000983)融资买入6670.18万元,融资偿还9158.41...
杭钢股份:7月18日融资买入7... 证券之星消息,7月18日,杭钢股份(600126)融资买入7237.96万元,融资偿还7993.11...
上交所:中信证券股份有限公司债... 7月21日,上交所发布关于中信证券股份有限公司2025年面向专业机构投资者公开发行短期公司债券(第三...
沪指半日涨0.44%,建材板块... A股三大指数21日早盘集体上涨,截至午盘,沪指涨0.44%,深成指涨0.29%,创业板指涨0.12%...
银之杰:7月18日融资买入1.... 证券之星消息,7月18日,银之杰(300085)融资买入1.06亿元,融资偿还1.04亿元,融资净买...
广州港:7月18日融券卖出50... 证券之星消息,7月18日,广州港(601228)融资买入392.53万元,融资偿还500.28万元,...
森泰股份:7月18日融资买入1... 证券之星消息,7月18日,森泰股份(301429)融资买入149.81万元,融资偿还288.24万元...
原创 不... 欧盟委员会主席冯德莱恩,近期对中国的强硬表态成了国际焦点。 先是威胁称如果中方不在稀土供应上“配合”...
美媒披露:特朗普发现和马斯克&... ► 文 观察者网 邵昀 “对美国政府来说,和马斯克‘分手’说起来容易,做起来难。” 美国《华尔街日报...
这家自媒体,把广告打进了苏超赛... 7月20日,苏超常州vs徐州的比赛现场,一块广告牌格外引人注目。出现在广告位上的,竟然有一家自媒体:...
左手增持右手质押,透视深圳前首... 5.55港元!尽管净利润指标持续承压,民生银行股价却持续刷新纪录。7月21日,伴随新老股东的进退变阵...
彻底引爆!刚刚,A股涨停潮! ... 1.2万亿引爆A股!今天早上,A股市场涨停个股一度达到100只以上,而这些股票当中,大部分跟雅鲁藏布...
AI古偶搞抽象,观众嗨了,钱在... 在如今的影视圈,AI 古偶呈现出一种独特的现象。当 AI 参与到古装偶像剧中时,画面和剧情往往充满了...
恒生指数早盘微涨0.28%,恒... 7月21日午盘,香港恒生指数微涨0.28%,报24895.20点;恒生科技指数上扬0.32%,报55...