月之暗面突袭:Kimi K2模型上线即开源,性能卓越引关注
2025年以来略显沉寂的月之暗面,在深夜突袭,7月11日晚宣布正式发布Kimi K2模型并同步开源。Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数为32B。本次开源的Kimi K2模型分为Kimi-K2-Base和Kimi-K2-Instruct两个版本,前者适合科研与自定义场景,后者在问答与Agent任务中有更好表现。
2025年以来,“Kimi们”的处境正发生改变,DeepSeek、MinMax等入场,大厂对AI热情再升级,大模型格局洗牌继续。月之暗面称,Kimi K2在多项基准性能测试中均取得开源模型中的SOTA成绩,在Agentic Coding、Tool Use和Math&Reasoning三个维度表现上均超过了DeepSeek-V3和阿里Qwen3。
目前,Kimi K2的API服务已上线,支持最长128K上下文,兼容OpenAI和Anthropic两种API格式。月之暗面也给出了Kimi K2在代码、Agent工具调用、风格化写作三项能力上的提升展示,如在前端开发任务中,Kimi K2支持粒子系统、可视化和3D场景等表现形式。

Kimi K2生成的山川峡谷3D景观图片来源:月之暗面Kimi官方公众号截图
而在Agent工具调用能力方面,Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列可直接执行的ToolCall结构。在其释出的案例中,Kimi K2规划了参加Coldplay乐队巡演的行程。
《每日经济新闻》记者也使用Kimi K2进行了旅游规划的测试,Kimi K2花费3分钟左右进行了一份详尽的旅游规划。随后,记者进一步提出将规划以HTML格式呈现,Kimi K2在随后交付的网页中补充了一些票务的信息,并完成了“图文并茂”的需求。

每经记者实测Kimi K2 图片来源:Kimi K2 截图
值得一提的是,此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现,扣子空间在网页的设计上完成度更高、更为美观。Kimi K2虽然在此略逊一筹,但旅游攻略制定上更为详细。
此外,Kimi K2还特别展示了其对文字输出风格的掌控,在虚构写作任务中,Kimi K2生成的文字更关注细节与情感。记者也以2025年北京高考的作文题目“数字闪耀时”为例,假设Kimi K2为高中生,完成一篇一类的记叙文,整体呈现效果良好。

由Kimi K2撰写的北京高考作文图片来源:Kimi K2 截图
Kimi也从技术角度透露,为了支撑万亿参数模型训练的稳定性,Kimi K2使用Muon优化器,显著提升token利用效率。
Kimi K2的突袭中,似乎隐含着要打一场翻身仗的决心。2024年11月,月之暗面创始人杨植麟表示,将提升用户留存视为Kimi眼下最核心的任务。商业智能数据服务商QuestMobile数据显示,截至2024年12月份,Kimi位列原生App领域的“三强”之一。但随着今年年初DeepSeek的横空出世,整个市场格局被迅速打乱。
今年5月,《每日经济新闻》联合QuestMobile发布的《2025年一季度AI应用价值榜》显示,Kimi虽仍在月均活跃用户规模上位于第四,但其2000万出头的规模已经和以1.8亿排在第一的DeepSeek相差甚远。2025年以来,Kimi对模型的更新升级速度明显放缓,但从2024年年底到今年5月份,Kimi先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。
此前6月20日,Kimi发布第一个Agent——Kimi-Researcher。知名经济学者、工信部信息通信经济专家委员会委员盘和林表示,Kimi的努力方向是对的,但还不够,Kimi需要将自己的AI嵌入到一个生态当中。
此外记者注意到,各家今年在升级大模型的时候往往也会“卷”到价格。6月17日,MiniMax发布MiniMax-M1系列模型,并以token范围分段定价。6月11日,豆包大模型1.6正式发布时,首创按“输入长度”区间定价。而本次Kimi K2的定价和DeepSeek-R1基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素。
(文章来源:每日经济新闻)
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: