首页站长新闻重磅!国内开源大模型Kimi K2登顶全球榜单

重磅!国内开源大模型Kimi K2登顶全球榜单

2025-07-24 999

Kimi K2是北京月之暗面科技有限公司于2025年7月11日推出的模型,上线即开源,在编程、通用Agent任务中表现更加出色,某些方面竟超赶DeepSeek!7月18日,国际权威大模型排行榜LMArena揭晓:海淀企业北京月之暗面科技有限公司研发的万亿参数开源模型Kimi K2强势登顶全球开源模型榜首!同时Kimi K2获得了超3000张社区投票,在大模型竞技场的总榜上排名第五!这款国产大模型新秀究竟表现如何?请跟随站长百科来一栏究竟。

重磅!国内开源大模型Kimi K2登顶全球榜单

北京月之暗面科技有限公司目前同步开源了Kimi K2系列中的两个模型版本:

  • Kimi-K2-Base:未经过指令微调的基础预训练模型,适合科研与自定义场景;
  • Kimi-K2-Instruct:通用指令微调版本(非思考模型),在大多数问答与Agent任务中表现卓越。

关于Kimi:Kimi是由月之暗面(Moonshot AI)提供的超长记忆AI助手,成立于2023年4月,总部位于海淀区知春路。Kimi支持约20万汉字的上下文输入,具备显著的中文优势,随时为你回答问题、速读文件、整理资料、激发灵感、辅助创作。你可以与Kimi聊天,发送网址链接,上传文件。

Kimi K2目前已在多方面展现出优异成果,例如在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的基准性能测试中取得优秀表现。

重磅!国内开源大模型Kimi K2登顶全球榜单

那么Kimi K2在处理上有哪些实际表现?Kimi K2项目组成员詹皓冰称:“一方面,Kimi K2的前端编程能力很强,在3D、游戏、动画制作等场景上,用简单的指令和Kimi K2交互,就能得到很惊艳的效果。另一方面,智能体(Agent)的工具调动能力也让模型整体上有了很大提升。”

来看看几个Kimi K2的使用案例:

以下是用Kimi K2生成的山川峡谷3D景观,支持昼夜循环:

重磅!国内开源大模型Kimi K2登顶全球榜单

Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines… (创建一个 3D HTML 山脉场景,包含悬崖、河流和昼夜光照变化。支持拖动和缩放、动画过渡、真实感渐变色,并可切换等高线显示…)

这是Kimi K2生成的粒子特效银河:

重磅!国内开源大模型Kimi K2登顶全球榜单

Prompt: Create a 3D particle galaxy with swirling nebulas, dynamic lighting. (创建一个 3D 粒子银河,包含旋转的星云和动态光照效果。)

这是Kimi K2 One-shot生成的期货交易系统,Kimi在无具体指令下,自动选用TradingView,搭建了完整的期货交易界面:

重磅!国内开源大模型Kimi K2登顶全球榜单

Prompt: Create a HTML!! an immersive browser-based futures trading simulator with professional-grade UI/UX using modern JavaScript libraries. Focus on real-time visualizations and interactive trading mechanics.(创建一个基于 HTML 的沉浸式浏览器期货交易模拟器,使用现代 JavaScript 库,具备专业级 UI/UX 设计。重点实现实时可视化和交互式交易机制。)

在改写任务中,Kimi K2能准确控制输出风格,例如让它模仿苹果广告文案,都能同时保留原意与表达风格。

重磅!国内开源大模型Kimi K2登顶全球榜单

Kimi K2官方技术报告总结如下:

Kimi团队表示,现如今大语言模型正从静态模仿学习向Agentic Intelligence转型,模型需要具备在复杂动态环境中自主感知、规划、推理和行动的能力。如要实现这些,就需要面临以下挑战:

  • 预训练需在高质量数据有限的约束下,通过提升每token效率构建通用先验(universal prior);
  • 后训练需将先验转化为可行动行为,但Agentic能力在自然数据中稀缺且难以规模化。

重磅!国内开源大模型Kimi K2登顶全球榜单

为此Kimi团队在Kimi K2中采用了以下三大核心创新技术:

1、MuonClip优化器:抛弃传统的Adam优化器,创新性地使用了Muon优化器。结合Muon的token效率与QK-Clip的稳定性,支持15.5万亿token无损失spike预训练。

2、大规模Agentic Tool Use数据合成:构建可大规模生成多轮工具使用场景的合成pipeline,覆盖数百领域、数千工具。

3、通用强化学习框架:结合可验证奖励(RLVR)和自我批判评估奖励,将对齐从静态扩展到开放域。

另外,Kimi K2目前已接入OpenRouter、Cline、Visual Studio Code等国际主流开发平台。Kimi团队成员刘少伟分享称,Kimi K2继承了DeepSeek-V3的架构,并在后者基础上进行增加专家数量、减少注意力头数量等调整,最终实现了较强的性能。由此可以看出,中国的开源模型已经形成良好生态,在互相借鉴中持续进步。

  • 广告合作

  • QQ群号:4114653

温馨提示:
1、本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。邮箱:2942802716#qq.com(#改为@)。 2、本站原创内容未经允许不得转裁,转载请注明出处“站长百科”和原文地址。

相关文章