杨植麟亲自发布!Kimi K2.5 开源新王驾到:指挥 100 子智能体集群,效率暴涨 450%

2026 年 1 月 27 日,月之暗面重磅官宣 —— 开源全新模型 Kimi K2.5,创始人杨植麟亲自发布视频解读核心亮点。这款以 Kimi K2 为基础架构、融合 15 万亿 “视觉 + 文本” 混合训练数据的新模型,最亮眼之处在于可自主调度 100 个子智能体集群,并行执行 1500 次工具调用,复杂任务效率较单智能体最高提升 4.5 倍,且全程无需预定义子智能体或工作流。

作为聚焦 AI 生态的社区,DeepSeek Club 带大家全面拆解这款 “开源新王” 的技术突破、性能表现与实用价值。

一、核心革新:智能体集群技术,从 “单个专家” 到 “专业团队”

Kimi K2.5 的核心突破是 “智能体集群” 能力,彻底重构复杂任务处理逻辑:

  • 自主调度与协调:模型可全自动创建 100 个子智能体组成的集群,按任务需求分配角色、并行推进,最多支持 1500 次工具调用协同;

  • 效率指数级提升:通过并行智能体强化学习(PARL)训练,端到端运行时间缩短 80%,复杂任务所需关键步骤减少至原先的 1/4~1/5.5;

  • 复杂场景适配:可处理大规模并行搜索、多文档整合、跨领域协作等任务,例如 100 个细分领域 YouTube 创作者筛选、40 篇论文的文献综述、全球婚礼旅行场景生成等。

二、性能霸榜:多维度测试第一,性价比拉满

Kimi K2.5 在多项权威基准测试中斩获榜首,同时兼顾性能与成本优势:

1. 基准测试屠榜

  • Agent 领域:HLE-Full(综合推理)、BrowseComp(浏览交互)、DeepSearchQA(深度搜索问答)三项第一;

  • 编码领域:SWE-Bench Verified、SWE-Bench Multilingual 双料冠军;

  • 多模态领域:文档理解测试 OmniDocBench 1.5 得分 88.8,位列第一,图像 / 视频转代码、视觉调试能力显著增强。

2. 性价比优势突出

API 价格较前代大幅下调,输入每百万 Token 仅 4 元(缓存输入 0.7 元),输出 21 元,较 K2 Turbo 最高降价 63.8%;与 GPT-5.2(xhigh)相比,性能逼近但成本显著更低,BrowseComp 场景成本节省 21.1 倍,HLE 场景节省 10.1 倍。

三、实用能力升级:四大模式 + 全场景赋能

1. 四大运行模式,适配不同需求

  • 快速模式:追求极速响应,满足日常简单查询;

  • 思考模式:深度拆解复杂问题,提供严谨解决方案;

  • Agent 模式:擅长深度研究、PPT/Excel/Word/PDF 生成、网页制作等任务;

  • Agent 集群模式:针对需并行处理的超复杂任务,发挥集群协同优势。

2. 办公与编程能力飞跃

  • 办公自动化:熟练掌握 Office 套件,支持 Word 批注、Excel 数据透视表、PDF LaTeX 公式编写,能处理万字论文、百页文档,AI 办公质量较 K2 Thinking 提升 59.3%;

  • 视觉编程突破:具备高级设计审美,可通过自然语言生成带动效的专业级网页,支持上传录屏重建网页,降低视觉表达门槛;

  • 编程生态完善:同步推出编程产品 Kimi Code,支持终端运行及 VSCode、Cursor、Zed 等主流 IDE 集成,开源且支持图像与视频输入,端到端编程任务能力较 K2 提升显著。

四、开源与生态:全平台开放,开发者好评如潮

Kimi K2.5 已在 Hugging Face、魔搭社区全面开源,方便开发者自由调用与二次开发。外网网友对其评价极高:

  • FireworksAI 联合创始人 Dmytro Dzhulgakov 称赞:“Kimi K2.5 = 开源 SOTA 推理 + 视觉 + 256K 上下文 + 智能体编码”;

  • 开发者通过 K2.5 快速生成网站页面、解决复杂编程谜题,直呼 “潜力巨大”。

五、行业意义:推动 AI 工业化落地,开源生态再添猛将

Kimi K2.5 的发布,不仅为开发者提供了一款高性能、低成本的开源模型,更以智能体集群技术为行业树立了复杂任务处理的新范式。其核心价值在于将 AI 从 “执行单一指令的工具”,升级为能自主协调、高效完成长周期、高复杂度知识工作的 “虚拟团队”,直击企业级应用的核心痛点。

作为深耕 AI 生态的社区,DeepSeek Club 将持续关注 Kimi K2.5 的应用落地动态,后续将推出相关技术解读、部署教程与实战案例。你对智能体集群技术有哪些期待?欢迎在评论区分享你的使用计划与见解!

这个智能体集群功能有点意思

智能体集群确实降维打击

这功能看着挺厉害啊

这功能看着挺厉害啊

听起来挺厉害的嘛

这个集群功能挺有意思的

这个智能体集群技术挺有意思的

这波开源确实给力