
用 Xinference 部署 DeepSeek R1 镜像没头绪?这份快速上手实用指南快收藏!
2025/09/16
黄老师
点击查看视频教程>>>>DeepSeek R1 镜像 /xinference 部署教程
在如今的技术应用场景里呀,很多朋友都想利用 Xinference 去部署 DeepSeek R1 镜像,可往往一着手做,就觉得摸不着头脑,不知道该从哪儿开始。别着急,下面我就把自己实际操作过的详细步骤分享出来,给大家一份实实在在能快速上手的实用指南,相信对大家会很有帮助哦,可得赶紧收藏起来呀。
一、部署前的准备工作
(一)硬件准备
在正式开始部署之前呢,咱们得先把硬件这方面给准备好,要知道不同规模的 DeepSeek R1 模型,对硬件的要求那可是不一样的。就比如说:
DeepSeek - R1 - 1.5B:它的 FP16 显存需求大概是 3GB,要是你硬件条件有限,最低用个 RTX 3050 显卡也能对付,甚至没有显卡光靠 CPU 也能进行推理,只不过速度会慢不少。这时候 CPU 配置最低得是 4 核处理器,内存要有 8G 才行。
DeepSeek - R1 - 7B:这个规模的模型,FP16 显存需求就变成 14GB 了,那显卡最低就得用上 RTX 3090 了,相应的 CPU 最低得是 8 核处理器,内存得达到 16G,像 Ryzen7 或者更好的 CPU 才行。
DeepSeek - R1 - 70B:这可就是个大家伙了,FP16 显存需求一下子飙到 140GB,那就得配备 4×A100/H100 - 80G 的显卡,CPU 方面呢,最低得是 Xeon 8 核的,内存更是要 128GB 或者更高配置才行。
(二)软件准备
二、安装 Xinference 及相关依赖
(一)创建 Conda 虚拟环境
(二)安装 chatglm - cpp
(三)安装 Xinference
三、启动 Xinference
四、配置注册模型文件
(一)下载模型文件
(二)注册模型文件
(三)启动模型文件
五、体验与模型对话
-
开设课程 开班时间 在线报名OCP2025.04.26
在线报名
HCIP-AI Solution2025.04.26在线报名
HCIE-openEuler2025.05.03在线报名
RHCA-CL2602025.05.04在线报名
HCIP-Cloud2025.05.10在线报名
PGCM直通车2025.05.10在线报名
HCIA-Datacom(晚班)2025.05.19在线报名
HCIA-Sec2025.06.07在线报名
RHCA-RH4422025.06.07在线报名
PMP2025.06.10在线报名
HCIA-Datacom2025.06.14在线报名
HCIE-AI Solution2025.06.14在线报名
HCIE-Datacom2025.06.14在线报名
HCIP-Datacom(晚班)2025.06.16在线报名
OCM2025.06.21在线报名
HCIE-Cloud2025.06.21在线报名
HCIP-Sec2025.06.21在线报名
HCIE-Bigdata2025.06.28在线报名
RHCE2025.06.28在线报名
HCIE-Datacom考前辅导2025.07.05在线报名
HCIP-Datacom深圳2025.07.19在线报名
CISP2025.07.19在线报名
HCIA-Datacom(晚班)2025.07.21在线报名
RHCA-RH4362025.07.26在线报名
OCP2025.07.26在线报名
HCIE-Sec2025.08.09在线报名
HCIA-AI Solution2025.08.16在线报名
HCIP-Datacom(晚班)2025.08.25在线报名
RHCA-RH3582025.09.06在线报名
PMP2025.09.16在线报名
HCIE-Datacom2025.09.06在线报名
HCIA-AI Solution2025.09.27在线报名
HCIA-Datacom2025.09.27在线报名
PGCM直通车2025.10.11在线报名
RHCA-DO3742025.10.11在线报名
HCIA-Sec2025.10.11在线报名
RHCE2025.10.18在线报名
HCIP-Datacom2025.11.08在线报名
HCIP-Sec2025.11.08在线报名
RHCA-CL2602025.11.15在线报名
OCP2025.11.15在线报名
HCIE-Sec2025.12.13在线报名
HCIE-Datacom2026.01.10在线报名



