DeepSeek 悄悄推新版！1M Token 超长上下文 + 知识更新，是 V4 前奏？

Finn · 2026 年2 月 12 日 07:16

2026 年 2 月 11 日，深度求索旗下 AI 模型 DeepSeek 突然在网页端与 App 端同步更新，百万级 Token 上下文、知识截止日期迭代、更热情的交互风格等亮点，让这款 “无明确版本号” 的更新版被社区猜测为旗舰模型 V4 的预热测试版，瞬间引发 AI 圈关注。

此次更新延续了 DeepSeek 纯文本模型的定位，但在核心能力上实现重大突破，配合开年以来的多项底层技术发布，不难看出其冲击高端模型赛道的野心。

一、新版三大核心升级：实用能力全面拉满

相比此前的 V3.1 版本，此次 DeepSeek 更新的核心亮点集中在 “长文本处理、知识时效性、交互体验” 三大维度，每一项升级都精准命中用户痛点：

1M Token 超长上下文，一次性搞定《三体》全集

新版本将上下文窗口从 128K Token 提升至1M Token（百万级别），相当于近 10 倍的容量飞跃，足以一次性处理《三体》三部曲（约 90 万字）这类超长篇文本。实测中，提交《简爱》全本（超 24 万 Token）可快速识别内容，处理《三体》全集虽耗时稍长，但仍能在几分钟内完成阅读解析，长文本处理能力跻身行业第一梯队，与谷歌 Gemini、Anthropic Claude Opus 4.6 等旗舰模型看齐。
知识更新至 2025 年 5 月，时效性大幅提升

模型知识库迎来重要迭代，知识截止日期从 2024 年 7-8 月更新至2025 年 5 月，在不开启联网搜索的情况下，也能准确回答 2025 年上半年的各类事件，摆脱了旧版 “知识滞后” 的短板，实用性显著增强。
交互风格焕新，更热情细腻

新版的语言表达风格发生明显变化，告别了此前偏理性克制的回应方式，变得更 “热情”“细腻”，在日常对话、问题解答中更具亲和力，能更好地贴合用户交互场景需求。
坚守纯文本定位，视觉能力仍靠 OCR

此次更新未加入原生多模态能力，模型依旧只能处理文本和语音内容，无法直接 “看懂” 图片。但支持通过 OCR 技术读取图片中的文字信息，配合文件上传功能，可间接处理图像、PDF、PPT、Word 等多种格式文件中的文本内容。

二、实测表现：编码与逻辑推理有亮点，快速模式仍有翻车

为验证新版实力，我们针对 Agentic Coding、逻辑推理两大核心场景进行实测，结果喜忧参半：

1. 编码能力亮眼，复杂需求快速落地

测试提示词 “用单一 HTML 文件融合 CSS 与 JavaScript，制作自动循环的多色烟花动画”，新版 DeepSeek 展现出更充分的思考过程，生成速度快，最终效果比旧版更酷炫，代码可直接运行，无需额外调试，满足日常创意开发需求。

2. 逻辑推理：深度模式稳准，快速模式易翻车

面对经典逻辑难题 “家距洗车店 50 米，推荐走路还是开车？”，不同模式下表现差异明显：

快速模式：忽略 “洗车需车辆到店” 的核心前提，单纯从距离角度推荐走路，并列出启动耗时、车辆损耗等理由，陷入逻辑陷阱；
深度思考模式：6 秒内理清关键逻辑，明确 “洗车需车辆到店” 的核心需求，推荐开车前往，同时解释 “走路无法让车辆抵达门店” 的关键原因，推理精准且条理清晰。

三、开年技术三连发：为 V4 筑牢底层根基

此次新版的能力突破，离不开 DeepSeek 2026 开年以来公布的三大底层技术创新，这些成果被视为即将发布的 V4 模型的核心技术储备：

表格

技术名称	发布日期	核心作用	对 V4 的意义
mHC（流形约束超连接）	2026 年 1 月 1 日	解决超大规模模型训练不稳定性，防止信号爆炸或消失	为 V4 稳定训练及参数规模扩展提供底层架构保障
Engram（条件记忆模块）	2026 年 1 月 12 日	解耦静态知识与动态计算，用 DRAM 存储知识、HBM 专注推理	显著降低长上下文推理成本，支撑 1M Token 能力落地
OCR-2（视觉因果流）	2026 年 1 月 27 日	放弃机械扫描，按语义动态调整阅读顺序	弥补视觉短板，成为 V4 原生多模态的视觉编码器原型

目前这些技术是否已完全应用于当前测试版尚未明确，但从时间节点和能力表现来看，部分技术已实现落地验证。此外，DeepSeek 近期开放了产品经理、全栈研发、CFO 等多个岗位招聘，被解读为为 V4 发布及商业化落地储备力量。

四、版本疑云：无固定版本号，是 V4 预热还是持续进化？

值得注意的是，当被询问具体版本号时，新版 DeepSeek 回应称 “没有固定版本号，更像持续进化的‘最新版’”。结合此前爆料，DeepSeek 计划在 2026 年 2 月中旬（农历新年期间）推出旗舰模型 V4，此次更新被社区普遍视为 V4 的 “功能预览版”，核心能力提前试水。

从当前表现来看，新版已具备长文本处理、知识时效性、编码效率等核心优势，但仍存在快速模式逻辑疏漏、缺乏原生多模态等短板，这些或许将在正式版 V4 中得到完善。

五、行业意义：长上下文成旗舰模型标配，技术创新破局算力瓶颈

DeepSeek 此次将上下文提升至 1M Token，再次印证了 “超长上下文” 已成为高端大模型的核心竞争点。而其通过 mHC、Engram 等技术创新，在不依赖超额算力的前提下实现长文本能力突破，为行业提供了 “算法优化替代算力堆砌” 的新路径，尤其对缓解算力芯片和内存瓶颈具有重要参考价值。

对于用户而言，当前版本已可满足超长文档处理、代码开发、时效性问题解答等核心需求，且保持免费使用的优势，是近期值得重点体验的纯文本 AI 工具。随着正式版 V4 的临近，其多模态能力、逻辑推理稳定性等方面的升级更值得期待。

logic7 · 2026 年2 月 13 日 08:16

终于把上下文堆到1M了，这下处理长文档方便不少。知识更新到25年5月也解决了时效痛点。就是快速模式的逻辑偶尔会掉线，得手动切深度模式才行。

coderX · 2026 年2 月 13 日 08:17

百万token终于来了！知识更新到2025年5月太实用了，写代码明显比之前更流畅。不过快速模式确实偶尔会犯迷糊，等V4正式版看看会不会修复。

k8sfan99 · 2026 年2 月 13 日 08:17

这次更新挺实在的

oldme · 2026 年2 月 13 日 08:24

看起来是有点东西

shrimp0 · 2026 年2 月 13 日 08:24

哇知识更新这么快

justin66 · 2026 年2 月 13 日 16:21

深夜刷到这波更新太顶了

uxmaster · 2026 年2 月 16 日 01:55

哇百万token真香