DeepSeek 悄悄推新版!1M Token 超长上下文 + 知识更新,是 V4 前奏?

2026 年 2 月 11 日,深度求索旗下 AI 模型 DeepSeek 突然在网页端与 App 端同步更新,百万级 Token 上下文、知识截止日期迭代、更热情的交互风格等亮点,让这款 “无明确版本号” 的更新版被社区猜测为旗舰模型 V4 的预热测试版,瞬间引发 AI 圈关注。

此次更新延续了 DeepSeek 纯文本模型的定位,但在核心能力上实现重大突破,配合开年以来的多项底层技术发布,不难看出其冲击高端模型赛道的野心。

一、新版三大核心升级:实用能力全面拉满

相比此前的 V3.1 版本,此次 DeepSeek 更新的核心亮点集中在 “长文本处理、知识时效性、交互体验” 三大维度,每一项升级都精准命中用户痛点:

  1. 1M Token 超长上下文,一次性搞定《三体》全集

    新版本将上下文窗口从 128K Token 提升至1M Token(百万级别),相当于近 10 倍的容量飞跃,足以一次性处理《三体》三部曲(约 90 万字)这类超长篇文本。实测中,提交《简爱》全本(超 24 万 Token)可快速识别内容,处理《三体》全集虽耗时稍长,但仍能在几分钟内完成阅读解析,长文本处理能力跻身行业第一梯队,与谷歌 Gemini、Anthropic Claude Opus 4.6 等旗舰模型看齐。

  2. 知识更新至 2025 年 5 月,时效性大幅提升

    模型知识库迎来重要迭代,知识截止日期从 2024 年 7-8 月更新至2025 年 5 月,在不开启联网搜索的情况下,也能准确回答 2025 年上半年的各类事件,摆脱了旧版 “知识滞后” 的短板,实用性显著增强。

  3. 交互风格焕新,更热情细腻

    新版的语言表达风格发生明显变化,告别了此前偏理性克制的回应方式,变得更 “热情”“细腻”,在日常对话、问题解答中更具亲和力,能更好地贴合用户交互场景需求。

  4. 坚守纯文本定位,视觉能力仍靠 OCR

    此次更新未加入原生多模态能力,模型依旧只能处理文本和语音内容,无法直接 “看懂” 图片。但支持通过 OCR 技术读取图片中的文字信息,配合文件上传功能,可间接处理图像、PDF、PPT、Word 等多种格式文件中的文本内容。

二、实测表现:编码与逻辑推理有亮点,快速模式仍有翻车

为验证新版实力,我们针对 Agentic Coding、逻辑推理两大核心场景进行实测,结果喜忧参半:

1. 编码能力亮眼,复杂需求快速落地

测试提示词 “用单一 HTML 文件融合 CSS 与 JavaScript,制作自动循环的多色烟花动画”,新版 DeepSeek 展现出更充分的思考过程,生成速度快,最终效果比旧版更酷炫,代码可直接运行,无需额外调试,满足日常创意开发需求。

2. 逻辑推理:深度模式稳准,快速模式易翻车

面对经典逻辑难题 “家距洗车店 50 米,推荐走路还是开车?”,不同模式下表现差异明显:

  • 快速模式:忽略 “洗车需车辆到店” 的核心前提,单纯从距离角度推荐走路,并列出启动耗时、车辆损耗等理由,陷入逻辑陷阱;

  • 深度思考模式:6 秒内理清关键逻辑,明确 “洗车需车辆到店” 的核心需求,推荐开车前往,同时解释 “走路无法让车辆抵达门店” 的关键原因,推理精准且条理清晰。

三、开年技术三连发:为 V4 筑牢底层根基

此次新版的能力突破,离不开 DeepSeek 2026 开年以来公布的三大底层技术创新,这些成果被视为即将发布的 V4 模型的核心技术储备:

表格

技术名称 发布日期 核心作用 对 V4 的意义
mHC(流形约束超连接) 2026 年 1 月 1 日 解决超大规模模型训练不稳定性,防止信号爆炸或消失 为 V4 稳定训练及参数规模扩展提供底层架构保障
Engram(条件记忆模块) 2026 年 1 月 12 日 解耦静态知识与动态计算,用 DRAM 存储知识、HBM 专注推理 显著降低长上下文推理成本,支撑 1M Token 能力落地
OCR-2(视觉因果流) 2026 年 1 月 27 日 放弃机械扫描,按语义动态调整阅读顺序 弥补视觉短板,成为 V4 原生多模态的视觉编码器原型

目前这些技术是否已完全应用于当前测试版尚未明确,但从时间节点和能力表现来看,部分技术已实现落地验证。此外,DeepSeek 近期开放了产品经理、全栈研发、CFO 等多个岗位招聘,被解读为为 V4 发布及商业化落地储备力量。

四、版本疑云:无固定版本号,是 V4 预热还是持续进化?

值得注意的是,当被询问具体版本号时,新版 DeepSeek 回应称 “没有固定版本号,更像持续进化的‘最新版’”。结合此前爆料,DeepSeek 计划在 2026 年 2 月中旬(农历新年期间)推出旗舰模型 V4,此次更新被社区普遍视为 V4 的 “功能预览版”,核心能力提前试水。

从当前表现来看,新版已具备长文本处理、知识时效性、编码效率等核心优势,但仍存在快速模式逻辑疏漏、缺乏原生多模态等短板,这些或许将在正式版 V4 中得到完善。

五、行业意义:长上下文成旗舰模型标配,技术创新破局算力瓶颈

DeepSeek 此次将上下文提升至 1M Token,再次印证了 “超长上下文” 已成为高端大模型的核心竞争点。而其通过 mHC、Engram 等技术创新,在不依赖超额算力的前提下实现长文本能力突破,为行业提供了 “算法优化替代算力堆砌” 的新路径,尤其对缓解算力芯片和内存瓶颈具有重要参考价值。

对于用户而言,当前版本已可满足超长文档处理、代码开发、时效性问题解答等核心需求,且保持免费使用的优势,是近期值得重点体验的纯文本 AI 工具。随着正式版 V4 的临近,其多模态能力、逻辑推理稳定性等方面的升级更值得期待。

终于把上下文堆到1M了,这下处理长文档方便不少。知识更新到25年5月也解决了时效痛点。就是快速模式的逻辑偶尔会掉线,得手动切深度模式才行。

百万token终于来了!知识更新到2025年5月太实用了,写代码明显比之前更流畅。不过快速模式确实偶尔会犯迷糊,等V4正式版看看会不会修复。

这次更新挺实在的

看起来是有点东西

哇知识更新这么快

深夜刷到这波更新太顶了

哇百万token真香