小模型,也是嵌入式的未来
创始人
2025-08-22 08:26:50

本文来自微信公众号:电子工程世界 (ID:EEworldbbs),作者:付斌


这两天,英伟达一个最新研究结论让业界备受关注——小型语言模型(SLM)才是智能体的未来。紧接着,英伟达又抛出了自己的全新小型语言模型:Nemotron-Nano-9B-V2,该模型在部分基准测试中达到了同类产品中的最高性能。


事实上,小型语言模型(SLM)的风,也刮到了MCU和MPU领域。


小模型,就是“压小”的大模型


小型语言模型(SLM)也许我们早有所接触。SLM的参数范围从几百万到几十亿不等,而LLM则具有数千亿甚至数万亿参数。


SLM是由LLM压缩而来,压缩模型需要在缩小模型的同时,尽可能保留模型的准确性。常见方法如下:


知识蒸馏:利用从大型“教师”模型转移的知识来训练一个较小的“学生”模型;


剪枝:移除神经网络架构中冗余或不那么重要的参数;


量化:降低计算中使用的数值精度(例如,将浮点数转换为整数)。


小型语言模型比大型模型更紧凑、更高效。因此,SLM需要较少的内存和计算能力,非常适合资源受限的边缘或者嵌入式设备。


许多小而强大的语言模型已经出现,证明大小并非一切。常见的10亿到40亿的SLM包括Llama3.2-1B(Meta开发的10亿参数变体)、Qwen2.5-1.5B(阿里巴巴的15亿参数模型)、DeepSeeek-R1-1.5B(DeepSeek的15亿参数模型)、SmolLM2-1.7B(HuggingFaceTB,的17亿参数模型)、Phi-3.5-Mini-3.8B(微软的38亿参数模型)、Gemma3-4B(Google DeepMind的40亿参数模型)。


跑SLM,靠得不光是算力


对MPU来说,跑SLM,似乎不是什么难题。但对开发人员来说,如何知道MCU支持是否支持运行生成式AI?


这个问题没有单一、直接的答案——不过有一个硬性要求,即MCU的神经处理单元(NPU)必须能够加速Transformer运行。


除此之外,跑生成式AI,对于MCU的带宽系统总线以及以及大容量、高速、紧密耦合的内存配置有要求。


其实,现在很多人都去只用GOPS(十亿次运算每秒)或TOPS(万亿次运算每秒)来比较微控制器的原始吞吐量,目前性能最佳的MCU能提供高达250GOPS的算力,而用于生成式AI的MCU将至少提供两倍于此的性能。但原始吞吐量并非衡量实际系统性能的理想指标。


因为成功的生成式AI应用程序需要支持Transformer运算,会在系统内部、内存、神经处理单元、中央处理器以及图像信号处理器等外围功能之间传输大量数据。因此,一个具有高原始吞吐量的系统理论上或许能快速处理大量数据,但如果系统无法将数据快速传输给神经处理单元,实际性能就会十分缓慢,令人失望。


当然,对MPU来说,大带宽、内存、总线之间的紧密耦合也至关重要。


Aizip与Renesas合作的SLM项目


早在去年8月,Aizip就与Renesas携手合作,在MPU上展示了用于边缘系统应用的超高效SLM和紧凑型AI Agents,这些小巧而高效的模型已经集成到基于Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。


Aizip创建了一系列超高效的小型语言模型(SLM)和人工智能代理(AI Agents),名为Gizmo,规模从3亿到20亿个参数不等。这些型号支持多种平台,包括适用于广泛应用的MPU和应用处理器。


SLM使设备边缘应用程序上的AI代理能够提供与大型语言模型(LLM)相同的功能,但在边缘占用空间上。设备上模型具有增强的隐私保护、弹性作和节省成本等优势。虽然一些公司已经成功地减小了手机语言模型的大小,但确保在低成本边缘设备上为自动化应用提供准确的工具调用仍然是这些SLM面临的重大挑战。


据介绍,在运行频率为1.2 GHz的单个A55内核的RZ/G2L上,这些SLM可以实现不到3秒的响应时间。


MCU,也在加大对SLM投入


Alif Semiconductor最近发布了最新系列的MCU和融合处理器——Ensemble E4、E6和E8,便主要针对支持SLM在内的生成式AI模型的运行。与此同时,Alif是首家使用Arm Ethos-U85 NPU(神经处理单元)的芯片供应商,该芯片支持基于Transformer的机器学习网络。


根据基准测试结果显示,该系列在不到2毫秒的时间内进行高能效物体检测、图像分类时间不到8毫秒、在E4设备上执行的SLM在生成文本以根据用户提供的提示构建故事时仅消耗36mW的功率。


Ensemble E4(MCU)采用双ArmCortex-M55内核,Ensemble E6和E8融合处理器分别基于Arm Cortex-A32内核和双Cortex-M55内核,值得注意的是E4/E6/E8均搭载双Ethos-U55+Ethos-U85,算力非常强大。


Alif认为,相比其他制造商,他们布局更早,因为第一代Ensemble MCU系列早在2021年就发布了,从那时起我们就一直在批量出货E1、E3、E5和E7设备。而在其他MCU厂商还停留在第一代AI MCU时,Alif就发布了第二代产品,同时是业界首款支持基于Transformer的网络的MCU,是LLM和其他生成式AI模型的基础。


SLM会是嵌入式的未来


SLM在大幅压缩模型体积的同时,尽可能保留了模型的准确性。这种高效、紧凑的特性,使其完美契合了资源受限的边缘和嵌入式设备,为这些设备带来了前所未有的智能能力。


事实上,边缘AI的未来图景正在徐徐展开,SLM也会是MCU和MPU厂商会布局的关键领域之一。


比如,意法半导体的STM32N6、英飞凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都开始重视NPU。


嵌入式AI最初主要是在Linux系统上运行的相对昂贵的基于微处理器的产品的一项功能。但很快,市场意识到边缘和端点设备中也有AI的空间——其中许多设备都是基于MCU。所以,在2025年下半年,先进的MCU厂商都将提供AI功能的产品纳入其产品组合中。这些厂商的NPU分为Arm Ethos IP一派和自研一派。目前来看,最新的Ethos-U85开始支持Transformer,并且在半年前展示了搭载SLM的效果,其他厂商也在不断跟进。在未来,相信SLM也会彻底改变MCU和MPU的格局。


参考文献


[1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models


[2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model


[3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/


[4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/


[5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

相关内容

热门资讯

会员日 | 市场沸腾时,更需专... 8月18日,A股再迎历史性时刻:沪指站上3728点创十年新高,沪深两市成交额突破2.76万亿元。截至...
1个月,2场胜仗,李斌从“斌子... 本文来自微信公众号:极客公园 (ID:geekpark),作者:极客公园汽车组,编辑:靖宇,原文标题...
闪回科技三闯港交所:背靠“小米... 近日,继2024年2月和9月两次递表后,深圳闪回科技有限公司(简称“闪回科技”)再次向港交所递交上市...
新帅上任一年,百年家化“刮骨疗... 何时能重回巅峰?文|《中国企业家》记者 李欣编辑|米娜头图来源|上海家化官网新帅上任一年,上海家化业...
别找英伟达的对标了,中国也有自... 星空君有两个业余爱好,一个是马拉松,一个是星空摄影。多年前,曾经在《天文爱好者》发表摄影作品,是《中...
江苏年薪185万的行长尚未官宣... 紫金农商银行尚未正式官宣史文雄辞任的公告,从江苏农商联合银行空降而来的阙正和已获聘任为行长,代为履行...
半导体概念股午后拉升 寒武纪总... 【半导体概念股午后拉升 寒武纪总市值突破5000亿再创历史新高】半导体概念股午后拉升,海光信息、盛美...
中国石化谈半年净利降近四成:将...   中新经纬8月22日电 中国石化董事长侯启军22日表示,7月份以来,国际油价相对稳定,公司生产经营...
罗永浩站在十字路口 罗永浩站在... 文 | 山核桃53岁的罗永浩以一种人们没有想到的方式出现了,他出现在康师傅的泡面新品直播间内,一共半...
沪指盘中突破3800点,芯片E... 8月22日午后,A股市场继续走强,沪指盘中突破3800点,刷新2015年8月20日以来新高。盘面上芯...
华为:2025年智能融合生产网... 今天分享的是:华为:2025年智能融合生产网建设指南 报告共计:77页 智能融合生产网建设指南总结 ...
辽宁绥中通报“未成年女孩做提眉... 针对“未成年女孩做提眉美容被缝80多针”的事件,8月21日,辽宁绥中县联合调查组公开通报称,涉事理发...
港股科技50ETF:8月21日... 证券之星消息,8月21日,港股科技50ETF(513980)融资买入6394.78万元,融资偿还90...
西藏天路:8月21日融资买入2... 证券之星消息,8月21日,西藏天路(600326)融资买入2.45亿元,融资偿还3.55亿元,融资净...
东芯股份:8月21日融资买入5... 证券之星消息,8月21日,东芯股份(688110)融资买入5.22亿元,融资偿还7.79亿元,融资净...
沪指突破3800点 沪指突破3... 2025.08.22作者 |第一财经沪指突破3800点整数关口,涨0.77%,AI芯片、Chiple...
金财互联:8月21日融资买入5... 证券之星消息,8月21日,金财互联(002530)融资买入5121.52万元,融资偿还6022.42...
戏水消暑打开消费新商机 水上装... 央视网消息:高温天气,玩水是消暑的好方式,水上运动的火爆也带动了相关装备的热销。在浙江义乌,不少商家...
中国A50:8月21日融资买入... 证券之星消息,8月21日,中国A50(159602)融资买入31.73万元,融资偿还66.4万元,融...
三利谱:8月21日融资买入11... 证券之星消息,8月21日,三利谱(002876)融资买入1113.73万元,融资偿还1292.78万...
明星机构云集,上海独角兽完成数... 来源:猎云网 近日,上海显耀显示科技有限公司(简称“JBD”)宣布,成功完成数亿元人民币的B1轮融资...
英伟达突发!A股芯片股掀涨停潮... 据多家媒体报道,英伟达已指示三星电子、安靠科技等关键零部件供应商暂停与H20芯片相关的生产。H20是...
颀中科技:8月21日融资买入2... 证券之星消息,8月21日,颀中科技(688352)融资买入2008.76万元,融资偿还2170.03...
铁流股份跌3.64%,成交额2... 来源:新浪证券-红岸工作室 8月21日,铁流股份跌3.64%,成交额2.80亿元,换手率8.62%,...
正丹股份:8月21日融资买入3... 证券之星消息,8月21日,正丹股份(300641)融资买入3324.88万元,融资偿还3492.95...
A股午评:沪指逼近3800点,... A股三大指数22日集体收涨,截至午盘,沪指涨0.67%,逼近3800点,深成指涨1.32%,创业板指...
天顺风能:8月21日融资买入1... 证券之星消息,8月21日,天顺风能(002531)融资买入1702.96万元,融资偿还1711.53...
23倍大牛股同洲电子上演造富神... A股市场上永远不缺造富神话,同洲电子(002052.SZ)股价在一年多的时间里暴涨近23倍,许多股东...
盐津铺子29亿营收背后:魔芋品... 本文来源:时代周报 作者:张钇璟图片来源:盐津铺子官方微博在休闲零食行业整体竞争白热化的当下,盐津铺...
险资猛砸万亿元,散户资金入市潜... 2025.08.22本文字数:3379,阅读时长大约5.5分钟作者 |第一财经 周艾琳从怀疑到惊讶,...