2026 年 3 月 29 日晚间,AI 圈被 #DeepSeek 崩了 #的热搜刷屏,这款热门 AI 工具的网页版突发服务中断,宕机时长超 11 小时,让正写论文、调代码、找 AI 倾诉的用户集体崩溃。这场看似突发的故障,却因宕机前模型能力的大幅提升,被业界解读为模型重大升级的前兆,而 DeepSeek 官方的沉默,更让新模型的神秘面纱充满悬念。截至发稿,该热搜阅读量达 7733.1 万,讨论量超 6.4 万,成为科技圈热议焦点。
宕机前的明显升级:三大变化印证模型更新
熟悉 DeepSeek 的用户都知道,这家公司向来有静默升级的习惯,不预告、不发公告,此次也不例外。在宕机发生前,不少用户就发现 DeepSeek 网页版的能力有了质的飞跃,从身份标识到知识储备,再到实际生成效果,都出现了明显变化,种种细节都指向一个结论:新模型已经悄悄上线。
1. 身份标识清晰化,首次明确标注 DeepSeek-V3
此前向 DeepSeek 询问版本信息,得到的答案始终是模糊的 “我是 DeepSeek,一款纯文字 AI 助手”,对版本号只字不提;而 3 月 29 日的新版本,会主动且稳定地自我介绍为DeepSeek-V3 模型(或其变体),还会告知用户可咨询参数、架构等技术细节,身份标识的转变,成为模型升级的首个直观证据。
2. 知识截止日期大幅更新,覆盖 2026 年初信息
在未开启联网搜索的前提下,新版本的知识储备有了明显拓展:能准确回答 2025 年美国选举结果这类时效性较强的问题,但对 2026 年 2 月的热点事件尚无认知。据此,业内推测新版本的知识截止日期已更新至 2026 年 1 月,相比老版本的 2025 年 5 月,信息新鲜度大幅提升。
3. 生成能力显著提升,SVG 绘图、代码开发效果翻倍
实际使用体验的提升,是最能让用户感知到的变化。经典的 SVG 画鹈鹕骑自行车测试中,3 月 29 日的 DeepSeek 在构图逻辑、色彩搭配上,比一周前的版本表现高出一个档次;而代码生成能力的提升更为突出,一次性写代码生成前端页面的效果大幅优化,页面完整性、代码可读性都有明显改善,有海外用户直言 “这是一次巨大的升级”。
至于此次升级的到底是微调后的 V3 模型,还是传闻已久的DeepSeek-V4 正式版,DeepSeek 官方始终保持沉默,未给出任何说明,也让行业对新模型的猜测愈演愈烈。而据此前技术爆料,DeepSeek-V4 早已完成研发,不仅支持百万 Token 超长上下文,还在中文能力、数学推理上实现了跨越式突破,此次静默升级,被认为是 V4 模型的首次公开试水。
宕机 11 小时的背后:多重原因叠加引发系统崩溃
这场持续超 11 小时的宕机,并非简单的技术故障,而是用户流量激增、算力供需失衡、技术架构瓶颈等多重因素叠加的结果,也暴露了 DeepSeek 在高速发展中面临的稳定性挑战。
1. 算力供需严重失衡,用户增长远超算力扩容
3 月底正值毕业季、求职季、企业项目交付期 “三碰头”,学生写论文、程序员调代码、职场人赶方案等高算力需求集中爆发,让 DeepSeek 的服务器迎来流量峰值。而数据显示,2025 年 DeepSeek 日活跃用户猛增 66.7%,但同期算力储备仅增长 8.3%,用户指数级增长与算力线性扩容的 “剪刀差”,让高峰时段的瞬时流量直接击穿系统承载极限,触发保护性限流,最终导致服务全面中断。
2. MoE 架构对算力调度要求高,加剧资源争抢
DeepSeek 核心模型采用的 MoE(混合专家)架构,虽能高效处理复杂任务,但对算力的 “弹性调度” 要求极高。当海量请求涌入时,系统需要动态将任务分配给不同的 “专家模型”,流量峰值下这一路由机制极易出现拥堵,引发 “局部瘫痪→全局崩溃” 的连锁反应。尤其是 “深度思考” 这类高阶功能,单次请求的算力消耗是普通对话的数倍,进一步加剧了服务器的资源争抢。
3. 基础设施短板凸显,扩容与灾备机制不完善
受全球高端 AI 芯片供应限制,DeepSeek 的算力扩容面临先天瓶颈,而国产芯片的适配效率和性能尚未完全满足需求,让算力提升难上加难。同时,平台的弹性扩容与多云灾备机制不够完善,无法快速应对突发流量,首次修复后仅 1 小时便再度异常,导致故障修复过程反复拉锯,宕机时长不断被拉长。此外,有行业消息称,故障期间 DeepSeek 疑似遭遇大规模 DDoS 攻击,海量恶意请求挤占了本就紧张的服务器资源,让情况雪上加霜(该说法尚未获官方证实)。
恢复服务仍有小问题:深度思考模式失效,老版本暂时回归
截至 3 月 30 日上午,DeepSeek 网页版已逐步恢复服务,但仍存在明显的功能问题,未能恢复至升级后的最佳状态,让用户的体验大打折扣。
最突出的问题是深度思考模式失效:开启该模式后,模型会正常进入思考状态,但思考结束后便会停止输出,无法将最终答案呈现在正文里,完全无法满足复杂推理、深度分析的需求。而如果关闭深度思考模式,从模型的自我介绍来看,其已暂时恢复为老版本 —— 知识截止日期回到 2025 年 5 月,也不再标注 V3 版本信息,相当于此次静默升级的新特性暂时无法使用。
对于故障原因、修复进度以及是否会对用户进行补偿,DeepSeek 官方目前仍未发布任何正式说明,也未回应新模型相关的猜测。
龙虾时代憋大招:狂招 17 个 Agent 岗位,布局 AI 智能体赛道
如果说模型升级和宕机是一次 “意外的曝光”,那么 DeepSeek 近期的招聘动作,则直接暴露了其在 AI 赛道的全新布局。在此次宕机事件前一周,DeepSeek 一口气开放了17 个核心岗位,且全部聚焦Agent(AI 智能体) 方向,从算法研究到数据评测,再到基础设施搭建,实现了 Agent 赛道的全链路布局,这也意味着,在 OpenClaw 引发的 “龙虾热” 中沉默许久的 DeepSeek,正全力进军 AI 智能体领域。
此次招聘的核心岗位包括 Agent 深度学习算法研究员、Agent 数据评测专家、Agent 基础设施工程师等,每个岗位都指向 AI 智能体的核心能力建设:算法研究员需要探索大模型在推理、指令遵循上的创新方法,深耕强化学习技术;数据评测专家负责构建高质量的 Agent 评测数据集,精准区分不同模型的能力边界;基础设施工程师则要搭建 Agent 运行的底层基座,打造高性能、高安全性的 Agent 运行时环境。
值得注意的是,多个岗位都明确要求候选人深度使用过 OpenClaw、Claude Code 等知名 Agent 工具,甚至将 “重度 Vibe Coding 用户” 列为加分项,可见 DeepSeek 的 Agent 布局并非纸上谈兵,而是瞄准了实际落地场景,试图结合当下最火的 AI 智能体技术,打造能执行复杂任务、自主完成工作流的新一代 AI 产品。
从静默升级疑似上线 V4 新模型,到狂招 Agent 方向人才布局全新赛道,再到此次因升级引发的宕机事件,种种信号都表明,DeepSeek 正在告别单纯的大模型工具阶段,向 **“大模型 + AI 智能体”** 的综合生态迈进。而此次宕机,虽让用户体验受损,却也让行业看到了其技术升级的决心,未来 DeepSeek 能否凭借新模型和 Agent 布局在 AI 赛道实现新突破,弥补此次宕机的口碑损失,值得持续关注。


