科技界又将迎来一场新的变革。
DeepSeek-V4要来了!
据《The Information》独家报道,中国领先的 AI 公司 DeepSeek 正紧锣密鼓地筹备发布其下一代旗舰模型 DeepSeek-V4,预计将于 2 月中旬,即2026年中国农历春节前后正式亮相。内部测试结果令人瞩目,有知情人士透露,DeepSeek-V4 在编程任务上的表现有望超越当前市场上的两大巨头——Anthropic 的 Claude 系列和 OpenAI 的 GPT 系列。
战略转向:从推理到编程
此次 DeepSeek-V4 的发布,标志着 DeepSeek 在模型架构上的又一次重大调整,也是继 R1 之后的又一里程碑。与以往专注于通用推理能力不同,V4 的核心方向已明确转向“编程”。这一战略转变并非偶然,而是深刻洞察了 AI 在个人和企业市场中的核心价值:编程能力才是 AI 的硬通货。
当前,编程领域的 AI 标杆是 Claude Opus 4.5,其在 SWE-bench Verified 上的表现以 80.9% 的成绩保持着领先地位。DeepSeek-V4 若要问鼎,不仅需要在代码生成方面展现卓越实力,更需在调试、调用外部工具等 Agent 能力上实现突破。报道特别指出,V4 在处理超长代码提示方面的进展,对于面临复杂软件项目开发的工程师而言,无疑将是一项“大杀器”。
R1 的回响与 V4 的前奏
回溯至去年 1 月 20 日,DeepSeek 在春节前夕发布的 R1 模型曾引发市场轰动。R1 以其在极低算力成本下媲美顶级模型的表现,在春节假期后导致美股芯片股集体暴跌,让硅谷首次意识到中国 AI 公司在成本效益上的强大竞争力。今年,DeepSeek 似乎有意复制这一成功,通过 V4 再次震撼业界。
在 DeepSeek-V4 正式发布之前,DeepSeek 已通过两个关键信号预示了其技术方向和雄心:
1.mHC 论文的发布:1 月 1 日,由创始人梁文锋署名的 mHC 论文公开发表。论文揭示,DeepSeek 成功将信号放大倍数从 3000 显著降低至 1.6,实现了三个数量级的飞跃。德国特里尔大学研究员 Florian Brand 曾指出,DeepSeek 的论文往往是其下一代模型技术方向的早期预警。
2.R1 论文的静默更新:1 月 4 日,R1 论文在未发布官方公告的情况下,版本号从 v1 悄然更新至 v2。页数从 22 页扩充至 86 页,新增了完整的训练流程披露,甚至包含了一个罕见的“失败尝试”章节,深入分析了 MCTS 在通用推理任务上的局限性。这种“防御性开源”策略,通常被解读为 DeepSeek 在为新模型清理技术债务,将现有技术细节公开存档,以便全力投入下一代模型的研发。
R2 的缺席与 V4 的融合
分析师普遍认为,DeepSeek 很可能不会单独发布 R2 模型。DeepSeek 已将 R1 的更新成果整合至 V3 模型中,而 mHC 技术极有可能成为 DeepSeek-V4 的核心技术骨架。这意味着 V4 将是 DeepSeek 技术积累和战略转型的集大成者。
结语
尽管 DeepSeek-V4 预计在 2 月中旬发布,具体时间仍可能有所变动。但可以肯定的是,继去年 R1 证明了中国 AI 公司能以十分之一的成本实现同等水平的模型性能后,DeepSeek 今年将通过 V4 进一步证明,其不仅在推理领域,在编程这一关键领域同样具备颠覆性实力。这不仅是 DeepSeek 的一次技术飞跃,也预示着 AI 编程领域即将迎来新的竞争格局。



