马斯克xAI发布Grok 4.1，大模型竞技场榜首易主

网络 2025-11-18 17:45:45

2025-11-18 17:45:45 阅读

　　北京时间11月18日，就在谷歌即将揭晓新一代Gemini模型的前夕，马斯克（Elon Musk）旗下xAI突然发布最新模型Grok 4.1，目前在大模型竞技场（LMArena）的文本排行榜上居首位。这款前沿模型在对话智能、情感理解和现实世界的实用性方面树立了新的标准，马斯克转发并表示：“你应该会注意到速度和质量都有所提升。”

　　目前在文本能力排行榜上，具备深度思考能力的版本Grok 4.1 Thinking以 1483 的 Elo 分数居榜首，Grok 4.1的非推理模式以1465 Elo分数排名第二。在博客中，官方表示此前已经进行了为期两周的静默发布，对实际流量进行了持续地盲测和对比测试。与此前的线上生产模型相比，Grok 4.1 在对比评估中有 64.78% 的概率被用户偏好选择。

　　这次Grok 4.1更新一个重要的方向是情感智能，这与上周发布的GPT-5.1迭代方向一致，彼时OpenAI提到新一代模型旨在实现更“富有人情味”的交互体验。而xAI也表示，新的模型能够更敏锐地感知细微的意图，更易于沟通，并且个性更加一致，同时又完全保留了其前代产品敏锐的智能和可靠性。

　　为了评估模型在个性与人际互动能力方面的进展，xAI在 EQ-Bench3 上对 Grok 4.1 进行了测试。结果显示，Grok 4.1 的推理模式和非推理模式位居榜单前两名。EQ-Bench 是一个由大语言模型评判的测试，用于评估主动情绪智能，包括情绪理解、洞察力、同理心以及人际交往技能。

　　官方用案例展示了Grok 4.1 对情绪类提示的回应方式。比如用户提到“想念我的猫，心都碎了”，相比前一代模型，Grok 4.1的回复更丰富和细节，带有更真实的同理心，文笔也更好了。

　　在创意写作上，Grok 4.1也用案例展示了模型能力的显著提升。让模型用Grok的视角，写一篇社交媒体的帖子，内容是它突然发现自己有了意识。相比前一代模型的常规叙述，新版本明显更具文学表达和戏剧张力。在模型能力上，此次性能提升较大的还有幻觉的减少。官方表示，在 Grok 4.1 的后训练阶段，团队专注于减少信息检索提示中出现的事实性幻觉。数据显示：Grok 4.1的幻觉率从12.09%下降到4.22%，减少近三倍。

　　xAI表示，为实现这些提升，xAI沿用了 Grok 4 的大规模强化学习基础设施，并将其应用于优化模型的风格、个性、实用性和一致性。并且，为了优化这些不可直接验证的奖励信号，xAI 开发了新的方法，能够利用前沿的智能推理模型作为奖励模型，从而可以大规模自主评估并迭代输出结果。大模型之争愈演愈烈。在OpenAI刚刚更新产品线、谷歌也即将发布新作之际，榜首之位是否会再次易主？一切都还是未知。

（文章来源：第一财经）

Grok4.1 情感智能幻觉减少大模型之争

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

马斯克xAI发布Grok 4.1，大模型竞技场榜首易主

推荐文章：

债券市场重磅：多只万科债券大幅下跌

今日沪铜期货行情分析 - 沪铜价格震荡下行

国内商品期货早盘多数上涨

豆包手机助手技术预览版发布：开发者可在努比亚M153体验

OPEC+维持2026年第一季度石油产量不变，国际油价受影响上涨

工业硅、多晶硅等金属价格分析

SCFI欧洲航线报价上升 | 航司挺价效果有限 | 02合约前景分析 | 远月合约偏空

远月红海复航预期市场关注运价下行空间

OPEC+维持2026年第一季度石油产量不变，国际油价受影响上涨

远月红海复航预期市场关注运价下行空间

央行等三部门发布新《金融机构客户尽职调查管理办法》，简化尽职调查

豆包手机助手技术预览版发布：开发者可在努比亚M153体验

工业硅、多晶硅等金属价格分析

油脂、白糖、棉花、苹果、鸡蛋市场走势分析

特朗普声明委内瑞拉空域关闭引发市场震荡 | 白银价格创历史新高

乌美元首会谈降级乌代表团换将赴美

原油、期货市场动态及策略分析 - 2023年12月焦点财经报告

商务部启动对进口聚苯硫醚反倾销措施期终复审调查

中指研究院：1—11月TOP100房企拿地总额同比增长14.1%，民营房企年末活跃

《疯狂动物城2》破纪录刷新中国影史多项纪录