当前位置: 首页 > news >正文

deepseek 私有部署文档

一、基于容器创建

进入节点后先启动容器,在容器中进行后续的操作(只需要执行一次就好,只要容器存在,下次直接进入就行)

docker run -it --device=/dev/dri --device=/dev/htcd --group-add video --name openwebui-vllm-deepseek --network=host --security-opt seccomp=unconfined --security-opt apparmor=unconfined --shm-size 100gb --ulimit memlock=-1 -v /gpfs_ssd/models/DeepSeek-R1-Distill-Llama-70B:/models/DeepSeek-R1-Distill-Llama-70B vllm:hpcc2.27.0.9-torch2.1-py310-ubuntu20.04-amd64 /bin/bash

--name openwebui-vllm-deepseek:容器名称,可随意更改,不与其他容器重复即可

/gpfs_ssd/models/DeepSeek-R1-Distill-Llama-70B:/models/DeepSeek-R1-Distill-Llama-70B:本地模型地址:容器模型地址

vllm:hpcc2.27.0.9-torch2.1-py310-ubuntu20.04-amd64:所基于启动的镜像

其他都是默认选项,一般情况下不推荐更改

创建容器后,以后执行以下命令即可,如果遇到容器关闭,先启动容器(docker start openwebui-vllm-deepseek),在执行以下命令进入,如果想关闭容器(docker stop openwebui-vllm-deepseek)

docker exec -it openwebui-vllm-deepseek bash

进入容器后,四卡启动ds

CUDA_VISIBLE_DEVICES=0,1,2,3 vllm serve /models/DeepSeek-R1-Distill-Llama-70B/ --port 8000 --device cuda --tensor-parallel-size 4 --gpu-memory-utilization 0.95 --max_model_len 8784

CUDA_VISIBLE_DEVICES=0,1,2,3:设置使用的GPU,可在0~7内选择,70B需要四卡

/models/DeepSeek-R1-Distill-Llama-70B/:本地模型的位置,注意这个值和后续API要保持一致

--port 8000:对外暴露的端口,默认8000,可按照自己的需求更改

--tensor-parallel-size 4:指定张量并行的大小,因为这次是4卡启动所以为4

--gpu-memory-utilization 0.95:GPU显存的最大利用率,0.95代表不会超过95%

--max_model_len 8784:指定模型可以处理的最大序列长度,不需要太长,够用即可

# # 等待这条命令运行完毕,即表示API启动完毕,可按照以下的形式通过postman进行验证(显示以下内容表示成功启动)

INFO: Started server process [15]
INFO: Waiting for application startup.
INFO: Application startup complete.
INFO: Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

注意:post后面的地址要更换为当前服务器的ip,比如当前是10.252.17.35,就用这个替换202.120.92.104,端口默认8000,如果更改就按照更改的来

二、postman调用

注意:model的值要与vllm serve所启动的模型地址一样,不然会被拒绝请求。
三、OpenWebUI部署

单独创建conda环境运行openwebui

conda create -n owu python=3.11 -y
conda activate owu --enable-reasoning
pip install open-webui -i http://mirrors.aliyun.com/pypi/simple

启动前设置好变量

export HF_ENDPOINT=https://hf-mirror.com
export ENABLE_OLLAMA_API=False
export OPENAI_API_BASE_URL=http://127.0.0.1:8000/v1
export RAG_EMBEDDING_MODEL=/workspace/all-MiniLM-L6-v2/
export DEFAULT_MODELS="/models/DeepSeek-R1-Distill-Llama-70B/"

启动即可

open-webui serve

启动后,可以在浏览器通过 10.252.17.35:8080 访问webui,之后可以进行对话

http://www.zskr.cn/news/16377.html

相关文章:

  • MySQL运维及开发规范
  • 异步读写mysql依赖pymysql (asyncio/ aiomysql)
  • Linux发行版切换技术全解析
  • 完整教程:高效Excel数据净化工具:一键清除不可见字符与格式残留
  • 手把手教你用 Docker 部署 Redis
  • 长租公寓的生存越来越难了 - 智慧园区
  • Spring Boot中保存前端上传的图片 - 教程
  • Linux--进程概念 - 详解
  • 设计模式——访问者设计模式(行为型) - 实践
  • Unity UI 性能优化终极指南 — Image篇 - 教程
  • HTB Eureka靶机渗透实战 - Spring Boot堆转储与Bash算术注入漏洞利用
  • 实用指南:Python编程基础(四) | if语句
  • 本地Markdown开源知识库选型指南 - 详解
  • 详细介绍:ROS2与Unitree机器人集成指南
  • plexe 通过提示词构建机器学习模型
  • 在AI技术快速实现创意的时代,挖掘游戏开发框架新需求成为关键
  • macOS 编辑字幕
  • [MCP] Register Prompt
  • Software Foundations Vol.I : Coq函数式编程(Basics)
  • CSS - transition 粗浅记忆
  • P4550 收集邮票
  • P1654 OSU!
  • 10/4
  • DynamoDB十年演进:云原生数据库的技术革新
  • NotImplementedError: Cannot convert a symbolic Tensor (lstm/strided_slice:0) to a numpy array.
  • HTML基础学习 - 教程
  • 7_如何构建知识图谱
  • WPF ContentControl Content Binding
  • 盛世华诞 举国同庆|热烈庆祝 LEWISAK 英勇重创消火栓 1 周年!
  • 完整教程:<el-table>构建树形结构