当前位置：首页 > news >正文

DeepSeek 部署过程中的问题

news 2026/2/8 15:16:04

文章目录

DeepSeek 部署过程中的问题
- 一、部署扩展：docker 部署 DS
- - 1.1 部署
  - 1.2 可视化
- 二、问题
- 三、GPU 设置
- - 3.1 ollama GPU 的支持情况
  - 3.2 更新 GPU 驱动
  - 3.3 安装 cuda
  - 3.4 下载 cuDNN
  - 3.5 配置环境变量
- 四、测试

DeepSeek 部署过程中的问题

1738492827_qdqfqc68qj.png1738492827238.png

Windows 中利用 ollama 来搭建 deepseek R1-CSDN博客

一、部署扩展：docker 部署 DS

1.1 部署

在上文Windows 中利用 ollama 来搭建 deepseek R1-CSDN博客中，我们使用Windows直接部署ollama，当然我们也可以使用docker来进行ollama的部署。 hub.docker.com/r/ollama/ollama

Docker安装到入门_deping 覆盖安装docker-CSDN博客

部署命令：

docker run -d --gpus=all -v ollama:/root/.ollama -p 9000:11434 -e OLLAMA_ORIGINS=* --restart always --name ollama ollama/ollama  # 在容器内部运行ollamadocker exec -it ollama ollama run deepseek-r1:7b  # 运行模型

命令运行后：
1738835627_m6n0j9clqs.png1738835625823.png

1738844955_nycubx07kw.pngPasted image 20250206175416.png

我们发现，ollama环境已被我们创建。

查看本地能否访问，并且在容器内部是否运行

1738835710_71vfykv1yv.png1738835709239.png

开始部署大模型

1738836333_u99stbl8rh.png1738836332618.png

1.2 可视化

我们创建的模型也可以在Chatbox网站进行调用Chatbox，而不是使用 docker 部署 web UI，这样过于浪费系统资源

1738836382_nbmgwii9hg.png1738836380700.png

1738836406_j1l8bvnh4p.png1738836405172.png

1738836440_l1xmrhpdkj.png1738836439654.png

二、问题

在我们运行deepseek-r1:7b，使用它生成内容时，会发现CPU被严重占用，这里我是使用 wsl 布置的 docker 容器，并且在容器中运行大模型。因此，ollama 其默认并没有使用 GPU 来运行 Deepseek，其是使用 CPU，来运行。

1738840498_80hdoag52i.png1738840496765.png

1738841006_7bktx4fg68.png1738841005476.png

而，GPU 却处于闲置的状态，而我们通过ollama list看到的processor：

1738841274_u9655bgtcp.png1738841273366.png

同时，结合torch库的检测

1738841448_01hbaew505.png1738841447318.png

我们可以断定，cuda不能运行，我们需要配置cuda

三、GPU 设置

3.1 ollama GPU 的支持情况

ollama-doc/ollama/docs/Ollama 对GPU 支持信息.md at main · qianniucity/ollama-doc · GitHub

Compute Capability	Family	Cards
9.0	NVIDIA	`H100`
8.9	GeForce RTX 40xx	`RTX 4090` `RTX 4080` `RTX 4070 Ti` `RTX 4060 Ti`
	NVIDIA Professional	`L4` `L40` `RTX 6000`
8.6	GeForce RTX 30xx	`RTX 3090 Ti` `RTX 3090` `RTX 3080 Ti` `RTX 3080` `RTX 3070 Ti` `RTX 3070` `RTX 3060 Ti` `RTX 3060`
	NVIDIA Professional	`A40` `RTX A6000` `RTX A5000` `RTX A4000` `RTX A3000` `RTX A2000` `A10` `A16` `A2`
8.0	NVIDIA	`A100` `A30`
7.5	GeForce GTX/RTX	`GTX 1650 Ti` `TITAN RTX` `RTX 2080 Ti` `RTX 2080` `RTX 2070` `RTX 2060`
	NVIDIA Professional	`T4` `RTX 5000` `RTX 4000` `RTX 3000` `T2000` `T1200` `T1000` `T600` `T500`
	Quadro	`RTX 8000` `RTX 6000` `RTX 5000` `RTX 4000`
7.0	NVIDIA	`TITAN V` `V100` `Quadro GV100`
6.1	NVIDIA TITAN	`TITAN Xp` `TITAN X`
	GeForce GTX	`GTX 1080 Ti` `GTX 1080` `GTX 1070 Ti` `GTX 1070` `GTX 1060` `GTX 1050`
	Quadro	`P6000` `P5200` `P4200` `P3200` `P5000` `P4000` `P3000` `P2200` `P2000` `P1000` `P620` `P600` `P500` `P520`
	Tesla	`P40` `P4`
6.0	NVIDIA	`Tesla P100` `Quadro GP100`
5.2	GeForce GTX	`GTX TITAN X` `GTX 980 Ti` `GTX 980` `GTX 970` `GTX 960` `GTX 950`
	Quadro	`M6000 24GB` `M6000` `M5000` `M5500M` `M4000` `M2200` `M2000` `M620`
	Tesla	`M60` `M40`
5.0	GeForce GTX	`GTX 750 Ti` `GTX 750` `NVS 810`
	Quadro	`K2200` `K1200` `K620` `M1200` `M520` `M5000M` `M4000M` `M3000M` `M2000M` `M1000M` `K620M` `M600M` `M500M`

3.2 更新 GPU 驱动

首先使用nvidia-smi，查看版本信息。

1738842761_3t8de2xshq.png1738842760541.png

也可以在控制面板查看版本信息，

1738843024_z6fbiury03.png1738843022904.png

如果没有把 NVIDIA 驱动更新到最新版，则需要在：

Download The Official NVIDIA Drivers | NVIDIA

1738843118_dpi9r7972p.png1738843116764.png

1738843148_9f2p2k3hw9.png1738843147219.png

3.3 安装 cuda

下载CUDA Toolkit：CUDA Toolkit 12.8 Downloads | NVIDIA Developer

1738843258_70wq698zih.png1738843257394.png

3.4 下载 cuDNN

CUDA Deep Neural Network (cuDNN) | NVIDIA Developer

选择与 CUDA 版本兼容的 cuDNN 版本进行下载。

1738844051_v3dd5fziie.png1738844050469.png

安装 cuDNN：
- Windows：解压下载的 cuDNN 文件，将其中的 bin、include 和 lib 文件夹中的文件复制到 CUDA 安装目录对应的文件夹中。
- Linux：解压下载的 cuDNN 文件，将其中的文件复制到 CUDA 安装目录。

使用nvcc -v查看信息
1738844249_ogzelrjs7l.png1738844248262.png

3.5 配置环境变量

1738844311_i9028z7nu7.png1738844310581.png

CUDA_SDK_PATH = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8
CUDA_LIB_PATH = %CUDA_PATH%\lib\x64
CUDA_BIN_PATH = %CUDA_PATH%\bin
CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

环境变量配置完记得重启
而后cmd运行：

cd "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.8\extras\demo_suite"bandwithTest.exe
deviceQuery.exe

第一个运行结果：

1738844501_myic8gw4di.png1738844500442.png

第二个运行结果：

1738844547_selzrhd64b.png1738844545963.png

配置完后，一定要记得重启。

四、测试

首先，我们使用torch测试：

1738847826_dlkkycb0p5.png1738847825643.png

发现可以检测到cuda的存在

其次，我们运行模型，先部署1.5b的蒸馏模型：

docker exec -it ollama 
ollama run deepseek-r1:1.5b # /bye  # 在进入终端聊天界面后，退出界面
ollama ps

1738847966_81cf6x5zy3.png1738847964838.png

可以发现，其GPU是100%占用的

而，我们运行7b的蒸馏模型时：

ollama stop deepseek-r1:1.5b 
ollama run deepseek-r1:7b# /bye  # 在进入终端聊天界面后，退出界面
ollama ps

1738848203_4ielr8riy7.png1738848202605.png

发现和原来是一样的，因此我推测，由于7b的模型太大，ollama 会自动调用CPU的资源，GPU没有问题

我们使用nvidia-smi进行GPU资源判断时：

当模型没有被调用时：

1738850112_7dcwooqy9k.png1738850111710.png

当模型被调用时：

1738850315_qlhaglsosi.png1738850314045.png

1738850396_271dvq5hxk.png1738850395088.png

发现 CPU 被调用了 82% ，但是 GPU 被调用了，但是调用的不多，虽然才 31%。

这可能是因为 ollama 模型本身的问题：ollama 的速度还不错，但受限于本地硬件配置。在MacBook、PC和边缘设备上运行小型模型时表现良好，不过遇到超大模型就有些力不从心了。

Ollama则是一个轻量级、易上手的框架，让在本地电脑上运行开源大语言模型变得更加简单。VLLM是一款经过优化的推理引擎，在令牌生成速度和内存管理效率上表现出色，是大规模AI应用的理想之选。

DeepSeek 部署过程中的问题

文章目录 DeepSeek 部署过程中的问题一、部署扩展：docker 部署 DS1.1 部署1.2 可视化二、问题三、GPU 设置3.1 ollama GPU 的支持情况3.2 更新 GPU 驱动3.3 安装 cuda3.4 下载 cuDNN3.5 配置环境变量四、测试 DeepSeek 部署过程中的问题 Windows 中利用 ollama 来…...

编程日记 2025/2/7 9:30:26

DeepSeek R1本地化部署 Ollama + Chatbox 打造最强 AI 工具

🌈 个人主页：Zfox_ 🔥 系列专栏：Linux 目录一：🔥 Ollama 🦋 下载 Ollama🦋 选择模型🦋 运行模型🦋 使用 && 测试二：🔥 Chat…...

编程日记 2025/2/7 9:21:17

应急场景中的数据融合与对齐

1. 概述在应急管理中，快速、准确地掌握现场状况、实时监控灾情并进行决策至关重要。各类数据（如卫星影像、无人机图像、激光雷达点云、地理信息系统（GIS）数据、传感器数据、社交媒体信息、移动终端数据等）具有来源广泛、格式多样、时空特性不同等特点。如何将这些异构数…...

编程日记 2025/2/7 9:18:14

手机上运行AI大模型(Deepseek等)

最近deepseek的大火，让大家掀起新一波的本地部署运行大模型的热潮，特别是deepseek有蒸馏的小参数量版本，电脑上就相当方便了，直接ollamaopen-webui这种类似的组合就可以轻松地实现，只要硬件，如显存&#xf…...

编程日记 2025/2/7 9:17:11

Mellanox网卡信息查看

1、查看Mellanox网卡的SN（序列号）和PN mstvpd 04:00.0或者lspci -s 04:00.0 -vvv来自https://enterprise-support.nvidia.com/s/article/MLNX2-117-2532kn 2、查看Mellanox网卡驱动、固件版本 ethtool -i ens6np0...

编程日记 2025/2/7 9:14:07

【漫画机器学习】083.安斯库姆四重奏（Anscombe‘s quartet）

安斯库姆四重奏（Anscombes Quartet） 1. 什么是安斯库姆四重奏？ 安斯库姆四重奏（Anscombes Quartet）是一组由统计学家弗朗西斯安斯库姆（Francis Anscombe） 在 1973 年提出的四组数据集。它们…...

编程日记 2025/2/7 9:13:05

TCP | RFC793

注：本文为 “ RFC793” 相关文章合辑。 RFC793-TCP 中文翻译编码那些事儿已于 2022-07-14 16:02:16 修改简介翻译自： RFC 793 - Transmission Control Protocol https://datatracker.ietf.org/doc/html/rfc793 TCP 是一个高可靠的主机到主机之间…...

编程日记 2025/2/7 9:06:57

2025蓝桥杯JAVA编程题练习Day2

1.大衣构造字符串问题描述已知对于一个由小写字母构成的字符串，每次操作可以选择一个索引，将该索引处的字符用三个相同的字符副本替换。现有一长度为 NN 的字符串 UU，请帮助大衣构造一个最小长度的字符串 SS，使得经过任意次…...

编程日记 2025/2/7 9:00:49

《解锁GANs黑科技：打造影视游戏的逼真3D模型》

在游戏与影视制作领域，逼真的3D模型是构建沉浸式虚拟世界的关键要素。从游戏中栩栩如生的角色形象，到影视里震撼人心的宏大场景，高品质3D模型的重要性不言而喻。随着人工智能技术的飞速发展，生成对抗网络（GANs&#xf…...

编程日记 2025/2/7 8:58:47

es match 可查而 term 查不到问题分析

es 匹配逻辑根本：es 的匹配是基于token 的。检索的query和目标字段在token 层级上有交集才能检索成功。对同样的文本，使用不同的分词器，所得token 不同。es 默认的analyzer(分词器)是standard模式，即按字切分。基本上&#xf…...

编程日记 2025/2/7 8:57:46

【OpenCV实战】基于 OpenCV 的多尺度与模板匹配目标跟踪设计与实现

文章目录基于 OpenCV 的模板匹配目标跟踪设计与实现1. 摘要2. 系统概述3. 系统原理3.1 模板匹配的基本原理3.2 多尺度匹配 4. 逻辑流程4.1 系统初始化4.2 主循环4.3 逻辑流程图 5. 关键代码解析5.1 鼠标回调函数5.2 多尺度模板匹配 6. 系统优势与不足6.1 优势6.2 不足 7. 总结…...

编程日记 2025/2/7 8:55:39

将有序数组转换为二叉搜索树(力扣108)

这道题需要在递归的同时使用双指针。先找到一个区间的中间值，当作子树的父节点，再递归该中间值的左区间和右区间，用于生成该父节点的左子树和右子树。这就是此题的递归逻辑。而双指针就体现在每一层递归都要使用左指针和右指针来找到中间值。…...

编程日记 2025/2/7 8:54:35

开放式TCP/IP通信

一、1200和1200之间的开放式TCP/IP通讯第一步：组态1214CPU，勾选时钟存储器第二步：防护与安全里面连接机制勾选允许PUT/GET访问第三步：添加PLC 第四步：点击网络试图，选中网口，把两个PLC连接起…...

编程日记 2025/2/7 8:45:19

S4 HANA (递延所得税传输)Deferred Tax Transfer - S_AC0_52000644

本文主要介绍在S4 HANA OP中S4 HANA (递延所得税传输)Deferred Tax Transfer - S_AC0_52000644的后台配置及前台操作。具体请参照如下内容： 目录 Deferred Tax Transfer - S_AC0_52000644 1. 后台配置 1.1 Business Transaction Events激活- FIBF 2. 前台操作 …...

编程日记 2025/2/7 8:43:13

如何从0开始做自动化测试？

自动化测试是使用软件工具在应用程序上自动运行测试的过程，无需任何人为干预。这可以通过减少手动测试的需要来保存时间并提高软件开发过程的效率。由于人为错误或不一致性，手动测试可能容易出错，这可能导致错误未被检测到。自动化测试通过…...

编程日记 2025/2/7 8:41:11

DeepSeek服务器繁忙问题的原因分析与解决方案

一、引言随着人工智能技术的飞速发展，DeepSeek 等语言模型在众多领域得到了广泛应用。然而，在春节这段时间的使用过程中，用户常常遭遇服务器繁忙的问题，这不仅影响了用户的使用体验，也在一定程度上限制了模型的推广和…...

编程日记 2025/2/7 8:38:08

C#，入门教程(10)——常量、变量与命名规则的基础知识

上一篇： C#，入门教程(09)——运算符的基础知识https://blog.csdn.net/beijinghorn/article/details/123908269 C#用于保存计算数据的元素，称为“变量”。其中一般不改变初值的变量，称为常变量，简称“常量”。无论…...

编程日记 2025/2/7 8:33:03

宏观经济：信贷紧缩与信贷宽松、通货膨胀与通货紧缩以及经济循环的四个周期

目录信贷紧缩与信贷宽松信贷紧缩信贷宽松信贷政策对经济影响当前政策环境通货膨胀与通货紧缩通货膨胀通货紧缩通货膨胀与通货紧缩对比经济循环的四个周期繁荣阶段衰退阶段萧条阶段复苏阶段经济周期理论解释经济周期类型信贷紧缩与信贷宽松信贷紧缩定义：金融…...

编程日记 2025/2/7 8:28:56

分层解耦.

三层架构 controller:控制层，接收前端发送的请求，对请求进行处理，并响应数据 service:业务逻辑层，处理具体的业务逻辑 dao:数据访问层(Data Access Object)(持久层)，负责数据访问操作，包括数据的增、删、改…...

编程日记 2025/2/7 8:26:54

一、客户端代码示例 import java.io.IOException; import java.net.InetSocketAddress; import java.nio.ByteBuffer; import java.nio.channels.AsynchronousSocketChannel; import java.nio.channels.CompletionHandler; import java.util.concurrent.ExecutorService; impo…...

编程日记 2025/2/7 8:24:51

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向深度学习与微纳光子学的结合主要集中在以下几个方向： 逆向设计通过神经网络快速预测微纳结构的光学响应，替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。特征提取与优化从复杂的光学数据中自…...

编程新知 2026/2/8 15:03:04

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

NLP学习路线图（二十三）：长短期记忆网络（LSTM）

在自然语言处理（NLP）领域，我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感，还是实现语言的翻译，都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心，而循环神经网络（RNN）曾被视为…...

编程新知 2026/2/1 7:05:28

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录一、SQL注入二、insert注入三、报错型注入四、updatexml函数五、源码审计六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...

编程新知 2026/2/5 2:28:27

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

每日一言今天的每一份坚持，都是在为未来积攒底气。案例：OLED显示一个A 这边观察到一个点，怎么雪花了就是都是乱七八糟的占满了屏幕。。解释 ： 如果代码里信号切换太快（比如 SDA 刚变，SCL 立刻变&#…...

编程新知 2026/2/6 0:50:24

九天毕昇深度学习平台 | 如何安装库？

pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子： 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

编程新知 2026/1/31 2:13:57