当前位置: 首页 > news >正文

DeepSeek 本地化部署与 WebUI 配置的方法

环境准备

  • 硬件要求 :推荐 Linux 操作系统,如 Ubuntu 20.04 及以上版本。内存至少 16GB,显存至少 8GB,SSD 硬盘空间至少 50GB,有支持 CUDA 的 NVIDIA GPU 更佳,推荐显存 16GB 及以上。
  • 软件依赖 :需要安装 Python 3.8 及以上版本,以及 pip 包管理工具。根据 NVIDIA GPU 型号和驱动版本,安装合适的 CUDA(11.2 及以上版本)和 cuDNN(8.1 及以上版本)。

安装部署

  • 安装 PyTorch :根据 CUDA 版本选择合适的 PyTorch 安装命令。例如,CUDA 11.2 的安装命令如下:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu112
  • 克隆代码库及安装依赖
git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek
pip install -r requirements.txt
  • 下载模型并配置路径 :从官方提供的链接下载 DeepSeek 模型权重,放置在 models/目录下,并设置模型路径和 GPU 设备号等环境变量:
export MODEL_PATH=models/deepseek_model.pth
export CUDA_VISIBLE_DEVICES=0

WebUI 配置

  • 使用 Open WebUI
    • 参考,先通过代码下载动态量化后的 DeepSeek 模型,如 1.58 bit 量化模型。
    • 编译并运行 llama.cpp,使用 llama-server 命令启动服务,如:
export LD_LIBRARY_PATH=$(pwd)/build/bin:$LD_LIBRARY_PATH
./build/bin/llama-server --model ./DeepSeek-R1-GGUF/DeepSeek-R1-UD-IQ1_S/DeepSeek-R1-UD-IQ1_S-00001-of-00003.gguf --host 0.0.0.0 --port 10000 --ctx-size 32768 --n-gpu-layers 61
* 将量化版模型服务接入 Open WebUI,点击左下角用户图标,进入管理员面板,依次点击 “设置”->“外部连接”->“管理 OpenAI API 连接”->“添加一个连接”,填入服务器 IP 和端口等信息。  
  • 使用 Ollama 配合 Chatbox
    • 安装 Ollama 后,通过命令行下载 DeepSeek-R1 模型,如 ollama run deepseek-r1:8b。
    • 下载安装 Chatbox,打开 Chatbox,选择设置 ->Ollama API,选择已安装的 DeepSeek-R1 模型并保存。
  • 使用 Open-WebUI :先安装 Docker,再通过以下命令安装 Open-WebUI:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装完成后,访问http://localhost:3000,注册登录后选择对应的 DeepSeek 模型即可开始对话。

http://www.xdnf.cn/news/219295.html

相关文章:

  • Fiddler抓取APP端,HTTPS报错全解析及解决方案(一篇解决常见问题)
  • 在Ubuntu中安装python
  • 02_高并发系统问题及解决方案
  • 大模型高效化三大核心技术:量化、蒸馏与剪枝详解
  • 【AI论文】BitNet v2:针对1位LLM的原生4位激活和哈达玛变换
  • 物流新速度:数字孪生让仓库“聪明”起来
  • 民锋视角下的价格波动管理思路
  • 健康养生:拥抱活力生活
  • 【AI提示词】机会成本决策分析师
  • 理解 EKS CloudWatch Pod CPU Utilization 指标:与 `kubectl top` 及节点 CPU 的关系
  • 企业架构之旅(3):TOGAF ADM架构愿景的核心价值
  • C#学习——类型、变量
  • SpringSecurity+JWT
  • linux安装部署配置docker环境
  • 基于STM32的虚线绘制函数改造
  • linux下创建c++项目的docker镜像和容器
  • try catch + throw
  • Python小程序:上班该做点摸鱼的事情
  • plm在车间管理中的重要作用
  • 4月29号
  • 浅谈工业RFID国产化替代趋势:技术自主化与产业升级是必然!
  • 定义接口的头文件和对应库文件之间的关系
  • 为什么要学习《金刚经》
  • 【linux】当nuc连接雷达之后,连接不上网络的解决方法
  • LangGraph简单使用
  • 制作一款打飞机游戏31:敌人数据库
  • 【MySQL】内置函数
  • 如何提高记忆力(马井堂)
  • C语言教程(二十一):C 语言预处理器详解
  • 1.7 点云数据获取方式——视觉SLAM