DeepSeek R1满血版671B 模型本地部署详细教程

2025-2-11

完整的671B MoE DeepSeek R1本地化部署详尽教程

DeepSeek R1模型，特别是其强大的671B MoE（混合专家模型）版本，今年来在AI领域引起了广泛关注。这款模型的创新性和强大能力无疑为许多开发者、研究人员和企业提供了巨大的潜力。然而，想要在本地部署并有效运行这一模型，尤其是完整的671B版本，很多人可能会觉得门槛过高。本文将提供详细的步骤指南，帮助大家在本地环境中使用Ollama成功部署DeepSeek R1的671B MoE版本，同时确保部署过程清晰易懂，实用性强。

一、为什么选择本地部署DeepSeek R1 671B？

虽然DeepSeek R1提供了在线服务和移动端应用，但对于那些追求定制化需求的用户，本地部署无疑提供了更多灵活性。通过本地化部署，您可以完全控制模型的运行方式，避免云端的延迟、费用以及隐私问题。

在本地化部署过程中，用户能够根据自身的硬件条件选择适合的量化版本。原始的671B模型文件庞大至720GB，显然无法适应普通用户的硬件环境。因此，本文推荐使用Unsloth AI提供的动态量化版本，通过量化技术显著减小模型的体积，使得更多用户能够在本地轻松部署。

二、模型选择与量化技术

1. 动态量化的优势

“动态量化”技术的核心思路是将模型中的关键层进行精细化的量化，而对不那么关键的混合专家层（MoE）进行较为粗糙的量化。通过这种方式，模型的大小大幅度压缩，甚至可以在一些消费级硬件上运行。

例如，原始的DeepSeek R1 671B模型文件的体积高达720GB，而通过动态量化技术，Unsloth AI将模型压缩至最小131GB，量化位数为1.58-bit，从而大幅降低了部署门槛，甚至在单台Mac Studio上也能运行。

2. 量化版本选择

Unsloth AI提供了4个不同量化版本供用户选择：

1.58-bit 动态量化版（131GB）
2.51-bit 动态量化版（212GB）
4-bit 标准量化版（404GB）

根据硬件配置不同，您可以选择适合的量化版本。如果硬件资源较为紧张，建议选择1.58-bit版本，而对于性能较强的硬件，可以选择4-bit版本。

三、硬件需求与配置

部署如此庞大的AI模型，硬件条件至关重要。这里列出了两种主要量化版本的硬件配置需求：

DeepSeek-R1-UD-IQ1_M（671B，1.73-bit动态量化，158GB）
- 推荐配置：内存 + 显存 ≥ 200 GB
DeepSeek-R1-Q4_K_M（671B，4-bit量化，404GB）
- 推荐配置：内存 + 显存 ≥ 500 GB

值得注意的是，部署过程中CPU和内存带宽是性能瓶颈，因此需要尽可能配备高性能的CPU和大容量内存。

测试环境配置：

GPU：四路RTX 4090（4×24GB显存）
内存：四通道DDR5 5600（4×96GB）
CPU：ThreadRipper 7980X（64核）

在这个配置下，短文本生成速度大约为7-8 token/秒，而长文本生成速度会降至1-2 token/秒。

如果硬件条件有限，可以选择1.58-bit量化版（131GB），该版本可以在配置较低的硬件（如Mac Studio）上运行。

四、部署步骤

1. 下载模型文件

从HuggingFace上下载您选择的量化版本的DeepSeek R1模型文件。下载时，建议使用下载工具（如XDM）来处理大文件。

下载地址：DeepSeek R1模型 - HuggingFace

下载后，您需要将分片文件合并成一个完整的.gguf文件。

2. 安装Ollama

前往Ollama官网并按照说明安装Ollama。安装命令如下：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，您就可以使用Ollama进行模型的加载和推理。

3. 创建模型描述文件（Modelfile）

使用文本编辑器（如nano或vim）创建一个新的模型描述文件（Modelfile）。例如，创建一个名为DeepSeekQ1_Modelfile的文件，并填写如下内容：

FROM /path/to/DeepSeek-R1-UD-IQ1_M.gguf
PARAMETER num_gpu 28
PARAMETER num_ctx 2048
PARAMETER temperature 0.6
TEMPLATE "<｜User｜>{{ .Prompt }}<｜Assistant｜>"

在上述内容中，FROM后面是您下载并合并后的.gguf文件路径，num_gpu设置为28是因为在四卡RTX 4090配置下，每张显卡能加载7层，总共28层。

4. 创建模型

执行以下命令创建模型：

ollama create DeepSeek-R1-UD-IQ1_M -f DeepSeekQ1_Modelfile

确保Ollama的模型存储路径有足够的空间来存放模型文件。

5. 运行模型

执行以下命令运行模型：

ollama run DeepSeek-R1-UD-IQ1_M --verbose

加上--verbose参数可以显示推理速度（token/秒）。如果遇到内存不足或CUDA错误，可以返回调整模型参数。

6. （可选）安装Web界面

您可以选择安装Open WebUI来为模型提供一个用户友好的界面：

pip install open-webui
open-webui serve

通过Web界面，您可以方便地与模型进行交互，查看生成的内容。

修改保存后重启 ollama 服务： sudo systemctl restart ollama

五、实际表现与建议

1. 模型生成效果

通过实际测试，1.73-bit和4-bit版本的DeepSeek R1在一些经典任务中表现非常出色。例如，模型能够准确回答诸如“strawberry”中有多少个字母“r”等问题。1.73-bit版本的生成效果较为“毒舌”，而4-bit版本则更加保守，倾向于拒绝不合适的提示。

2. 性能瓶颈

在本地部署时，CPU的利用率通常较高，而GPU的利用率较低。这表明，性能瓶颈主要来自于CPU和内存带宽。因此，建议使用高性能的CPU和大容量内存来优化性能。

3. 适用场景

短文本生成：对于短文本任务，如单轮对话或简单的文本生成，1.58-bit量化版本非常合适。
长文本生成：如果需要处理长文本生成，可能需要更高的显存和内存资源，或者选择配置更高的GPU。

六、结论

通过以上步骤，您可以在本地部署DeepSeek R1 671B MoE模型，享受其强大的AI能力。虽然部署过程中存在硬件要求较高的挑战，但通过合理选择量化版本和优化配置，许多用户仍然可以在自己配置的工作站上顺利运行这一模型。

如果您在部署过程中遇到问题或有其他疑问，欢迎在评论区留言讨论！

声明：部分内容、图片来源于互联网，如有侵权请联系删除，QQ：228866015；咨询请点击右侧在线客服，咨询在线QQ客服。

[ 返回 ]

上一篇：Deepseek-R1 671B满血版本地部署：GPU跑无蒸馏量化方案全解析
下一篇：DeepSeek模型本地部署服务器配置指南：选择适合你的硬件规格

1对1专业客服

24小时服务支持

365天无间断服务

5分钟快速响应

产品与服务: 全球服务器租用; 服务器托管; 全球云主机; 全球域名注册; 服务器运维维护; 企业邮箱邮局

行业解决方案: 游戏解决方案; 金融解决方案; 直销解决方案; 站群解决方案; 企业解决方案; 负载均衡解决方案; 视频解决方案

帮助中心: 全球CDN定制; 全球点对点专线; 服务器租用问题; 服务器托管问题; 备案问题; 虚拟主机问题; 云主机问题

关于我们: 公司介绍; 媒体报道; 合作伙伴; 团队建设; 加入我们; 新闻媒体; 付款方式

天下数据：做天下最好的IDC服务商

Tel：400-638-8808（7x24h）

《中华人民共和国增值电信业务经营许可证》 ISP证：粤ICP备07026347号

深圳总部：中国·深圳·南山区·国际创新谷六栋B座10层 7×24小时销售热线：4006388808

香港分部：香港上環蘇杭街49-51號建安商業大廈7樓香港服务电话：+852 67031102

本网站的域名注册业务代理北京新网数码信息技术有限公司的产品

本网站的域名注册业务代理商中在线科技股份有限公司的产品

亚洲服务器
香港电信服务器	CTG香港大带宽	香港RS裸金属	香港自建机房	香港沙田服务器	香港站群服务器	香港服务器
香港高防服务器	香港ML机房服务器	澳门服务器	韩国服务器	日本服务器	泰国服务器	新加坡服务器
台湾服务器	印度尼西亚服务器	阿联酋迪拜服务器	巴基斯坦服务器	越南服务器	马来西亚服务器	菲律宾服务器
哈萨克斯坦服务器	柬埔寨服务器	印度服务器	孟加拉国服务器

美洲服务器
美国洛杉矶机房	美国CR机房	美国圣何塞机房	美国达拉斯机房	美国C3机房	美国圣安娜机房	美国站群服务器
美国迈阿密机房	美国无限防御服务器	美国大带宽服务器	亚特拉大服务器	西雅图服务器	佛吉尼亚服务器	丹佛服务器
芝加哥服务器	加拿大服务器	巴西服务器	智利服务器	阿根廷服务器	哥伦比亚服务器

欧洲服务器
法国服务器	意大利服务器	德国服务器	英国服务器	荷兰服务器	俄罗斯服务器
比利时服务器	土耳其服务器	波兰服务器	西班牙服务器	瑞士服务器	捷克服务器
立陶宛服务器	马其他服务器	保加利亚服务器	塞浦路斯服务器	芬兰服务器

非洲服务器	大洋洲服务器	站群服务器
埃及服务器	澳洲服务器	香港站群	美国站群	日本站群	新加坡站群	韩国站群

大陆服务器
北京服务器	江苏服务器	河南联通中原数据基地	濮阳联通机房	南阳移动机房	郑州多线机房
福建泉州移动机房	四川成都电信高防机房	四川德阳电信高防机房	江苏宿迁移动高防	济南骨干联通高防机房	厦门电信高防机房
泉州电信高防机房	安溪高防机房	宁波低端BGP机房	宁波BGP高防区	扬州快快通BGP机房	扬州多线BGP机房
杭州BGP高防机房	台州BGP高防机房	东莞BGP高防机房	江苏低防BGP机房	国内机柜租用	厦门高防BGP机房
深圳服务器	广州服务器	佛山服务器	东莞服务器

.com85元/年		.cn75元/年		.wang58元/年		.me246元/年		.cc138元/年		.hk380元/年
域名增值服务：免费域名解析免费域名证书免费whois信息保密