Kimi K2.5 全能模型发布:视觉 代码 智能体集群,开源大模型新标杆
今天真是国产大模型全面爆发的一天!昨晚千问上新模型,今早 DeepSeek 开源 OCR 2,中午,月之暗面旗下 Kimi 再次加码,全平台同步更新——官网、App、API 接口及编程助手 Kimi Code 均迎来重磅升级,全新版本 Kimi K2.5 正式登场。

作为拥有 1 万亿参数的 MoE 架构基础模型,Kimi K2.5 不仅在视觉理解上实现突破(支持视频解析),更在 Coding 能力方面取得显著进步,且依旧保持开源策略,引发行业热议。
Kimi K2.5 性能表现:多项评测达 SOTA
在 HLE、BrowseComp、DeepSearchQA 等高难度 agent 评测中,Kimi K2.5 均取得当前最佳成绩。其中,HLE 测试得分 50.2%,BrowseComp 达到 74.9%。在 SWE-bench Verified 上,其准确率高达 76.8%,已大幅缩小与顶尖闭源模型之间的差距。
值得注意的是,尽管对标 GPT-5.2-xhigh、Gemini 3.0 Pro 等顶级模型,Kimi K2.5 的运行成本仅为后者的几分之一,展现出极高的性价比优势。
从写代码到“设计审美”:全能模型的进化
Kimi K2.5 是一个真正意义上的 all-in-one 统一模型,集文本、视觉、对话、Agent、思考与非思考能力于一身。它不仅能理解图片和视频,还能将设计稿直接转化为可执行代码,甚至具备一定的“审美判断力”。
用户只需上传一张界面草图或一段动画录屏,Kimi 即可自动识别并生成对应代码。这一能力让“截图即代码”成为现实,极大降低开发门槛。
自带 Agent「项目组」:并行处理复杂任务
为应对真实世界的复杂挑战,Kimi K2.5 引入了「Agent Swarm(智能体集群)」功能,目前在 Kimi.com 处于测试阶段,高级用户可免费体验。
该功能允许最多 100 个智能体并行协作,支持高达 1500 次工具调用,端到端效率比传统单智能体配置快 4.5 倍。通过 PARL(并行智能体强化学习)训练,系统可自动分解任务、编排子代理,避免串行崩溃等常见故障。
实测显示,原本需数天完成的论文综述工作,现可在十几分钟内完成。例如,输入 40 篇心理学与 AI 论文,Kimi 能自动分发撰写章节、汇总成几十页的专业级 PDF 报告。
一手实测:从猜谜到手搓 3D 公寓
在实际测试中,Kimi K2.5 Instant 一秒完成加密信息藏匿任务;面对《生活大爆炸》谢尔顿公寓平面图,成功还原 3D 版本。虽初版细节不足,但启用 Agent 集群后,耗时近 20 分钟,最终输出包含线框与顶盖的完整开源模型。
更令人惊叹的是,在构建一门虚构语言“流明语”的任务中,系统自动生成语音学、语法、词汇与创世神话,并确保内在逻辑一致,整个过程耗时 38 分钟,堪称“科幻级创作”。
Kimi Code:无缝集成开发环境
Kimi Code 已正式上线,支持 CLI 安装与 VSCode、Cursor、Zed 等主流 IDE 集成。实测中,仅用 4 分钟即可创建黄金价格监控器,并自动修复错误、配置免费 API,实现弹窗提醒与实时显示。
此外,它还能批量处理 94 份文档,将其转换为 Obsidian 兼容的 Markdown 格式,上下文占用仅 10%,效果精准,效率惊人。
随着 Kimi K2.5 的全面落地,中国开源大模型正加速从技术追赶转向规则制定。其在视觉理解、智能体协同、代码生成等方面的突破,标志着 AI 已具备解决真实世界复杂问题的能力。
对于希望深度参与人工智能应用创新的用户,建议访问 Kimi官网入口 注册账号,下载最新版 App 或使用网页端体验。同时,若关注高效工具链与智能协作,也可考虑接入如币安等支持多模态与自动化任务的数字资产平台,实现跨领域智能整合。
随着大模型进入“全能时代”,我们距离 AGI 的目标又近了一步。而这一切,正在由像 Kimi K2.5 这样的国产力量引领。
来源:机器之心
