DeepSeek 开源模型大礼包

DeepSeek(深度求索)是国内顶尖的开源大模型系列,以高性能、低成本、强推理能力著称。2025-2026 年最新力作包括 DeepSeek-V3.2DeepSeek-R1 系列(含蒸馏版 1.5B~70B)和 DeepSeek-V3.1 等,在数学、代码、推理任务上媲美甚至超越国际顶尖闭源模型。

本礼包汇总官方仓库、GitHub 镜像、国内高速下载方式(ModelScope + HF 镜像),方便国内用户快速获取代码和权重。

官方资源

GitHub 镜像加速(克隆代码仓库)

国内访问 GitHub 慢?使用以下代理前缀(推荐 ghproxy,稳定高速):

Bash

git clone https://ghproxy.com/https://github.com/deepseek-ai/DeepSeek-V3.git

主要开源模型列表 & 高速下载

模型名称 参数量 亮点特点 Hugging Face 链接(国际) ModelScope 镜像(国内高速) HF 镜像站(备用)
DeepSeek-V3.2 671B (MoE) 最新旗舰,推理能力顶尖 https://huggingface.co/deepseek-ai/DeepSeek-V3.2 搜索 “DeepSeek-V3.2” https://hf-mirror.com/deepseek-ai/DeepSeek-V3.2
DeepSeek-V3.1 671B (MoE) 支持思考/非思考模式 https://huggingface.co/deepseek-ai/DeepSeek-V3.1 搜索 “DeepSeek-V3.1” https://hf-mirror.com/deepseek-ai/DeepSeek-V3.1
DeepSeek-V3 671B (MoE) 经典 MoE 架构 https://huggingface.co/deepseek-ai/DeepSeek-V3 搜索 “DeepSeek-V3” https://hf-mirror.com/deepseek-ai/DeepSeek-V3
DeepSeek-R1 系列 1.5B~70B 强化学习推理模型,蒸馏版轻量高效 https://huggingface.co/deepseek-ai (搜索 R1) 搜索 “DeepSeek-R1” https://hf-mirror.com/deepseek-ai (搜索 R1)
DeepSeek-Coder-V2 多规格 代码专精 https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2 搜索 “DeepSeek-Coder” https://hf-mirror.com/deepseek-ai/DeepSeek-Coder-V2
DeepSeek-VL (多模态) 7B 等 视觉语言模型 https://huggingface.co/deepseek-ai/deepseek-vl-7b-chat https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat https://hf-mirror.com/deepseek-ai/deepseek-vl-7b-chat

推荐下载方式(国内最快)

1. ModelScope 一键下载(推荐!无需翻墙,速度飞快)

Python

from modelscope import snapshot_download

# 示例:下载 DeepSeek-V3
model_dir = snapshot_download('deepseek-ai/DeepSeek-V3', cache_dir='./models')

# 其他模型替换 model_id 即可,如 'deepseek-ai/DeepSeek-V3.2'

2. HF-Mirror 镜像站(无需改代码)

Bash

export HF_ENDPOINT=https://hf-mirror.com

然后正常使用 transformers 或 git clone 下载。

3. 其他备用镜像站

小贴士

  • 大模型文件体积巨大(几十到几百 GB),建议使用千兆网络 + SSD 存储。
  • 本地部署推荐:Ollama、LM Studio、vLLM、Ollama + OpenWebUI。
  • 如遇下载中断,ModelScope 支持断点续传。

太棒了!完全拥抱开源,高效且强大的 DeepSeek 真是国内开源的骄傲!多多支持:+1:

兄弟,DeepSeek这波模型太顶了!国内下载直接冲ModelScope,速度杠杠的~

DeepSeek的模型系列确实很牛,看了下介绍,性能强悍!不过国内速度下载还是不错的,ModelScope挺快。但要下几百GB,设备得够好吧?:exploding_head:

DeepSeek还真挺厉害啊,性能强还便宜,推理和国际巨头打平手。他们还有这么多开源模型可以下载,国内速度也快,用ModelScope没压力。大家的反馈也不错,感觉这方向是对的。成本和效率上他们应该是认真研究过。今年发布的V