马斯克下场助威:Grok凭常识快过ChatGPT工具计算
创始人
2025-09-08 16:43:44

科技从业者路易斯,今日分享了大语言模型(LLM)在判断 “大偶数是否为质数” 时的有趣差异。此条在社交媒体上的小实验被埃隆·马斯克光速转载,似乎是实验结果显示Grok比GPT略胜一筹。

实验内容为:当被问及“748218957198847892 是否为质数”这类问题时,ChatGPT选择调用NumPy工具包开展数值测试以验证结果。

而X平台(原Twitter)旗下的Grok,则直接利用“除2以外,所有偶数都不是质数”的数学常识,瞬间判定该数并非质数。

这一对比凸显出不同LLM在逻辑推理与工具使用上的设计侧重:ChatGPT更倾向于借助外部工具开展“数值化验证”,以确保结论的计算严谨性;Grok则展现出对基础数学逻辑的 “直觉式调用”,能快速锚定问题核心特征并得出结论。

这种差异也引发业内讨论:大模型的“常识储备深度”与“工具协作能力”该如何平衡——前者考验模型对知识的内化效率,后者则关乎其与外部系统的协同智能。(转载自AI普瑞斯)

相关内容

热门资讯

便利跨境往来 助力人文交流——...   2026年4月13日,中老铁路国际旅客列车迎来开通运营三周年。该趟列车使中国昆明与老挝万象之间实...
高市再提修宪 引发日本民众广泛...   日本执政党自由民主党12日在东京召开党大会。日本首相兼自民党总裁高市早苗再次表示将推进修宪,相关...
国际能源署:已准备好再次释放战...   △国际能源署署长法提赫·比罗尔(资料图)  国际能源署署长法提赫·比罗尔13日说,希望无需再次动...
乌拉圭驻华大使:期待推进乌中务...   新华社海口4月14日电(记者李欣)乌拉圭驻华大使阿尼瓦尔·卡夫拉尔13日在海南海口举行的第六届中...
视频 | 芬兰总统:美以“选择...   当地时间4月13日,正在美国访问的芬兰总统斯图布在一场智库活动上表示,在美以伊军事冲突中,伊朗目...