当前位置：首页 > news >正文

deep seek R1本地化部署及openAI API调用

news 2026/2/8 17:01:52

先说几句题外话。

最近deep seek火遍全球，所以春节假期期间趁着官网优惠充值了deep seek的API，用openAI的接口方式尝试了下对deep seek的调用，并且做了个简单测试，测试内容确实非常简单：通过prompt提示词让大模型对用户提问做一个简单的提问场景判断，分了3个大类：一个是能耗问题，比如用户提问包括电流、电压、功率、能耗、耗能情况等等，判断为能耗问题。一个是生产问题，比如产量、产品等等，生产问题需要识别用户提问的日期范围之后转化为格式化输出，以便调用生产系统API获取数据。除此之外就是通用问题。

重点测试了生产相关的产量问题的日期范围测试，分别调用过讯飞的generalv3，智普的glm-4-plus，openAI的gpt-4o，提问比如上周的产量怎么样，不论我怎么调整提示词，generalv3都识别不出“上周”的时间范围，相同提示词的情况下，gpt-4o表现最好，识别的准确率最高，智普的glm-4-plus也还可以。

春节前用deepseek-reasoner试了下，对这个简单问题的表现很不错，因为我的openAI的apikey已经到期了所以没有办法对比测试了，但是单独测试deepseek-reasoner，每次都可以准确识别上周、上个月等时间范围。

其实这个测试是为了对function calling做一个简单的准备，验证一下将来如果有相关场景的话，是否可以通过funcation calling使大模型和业务系统做一个对接。前期测试结果并不能反映出模型是否支持我的业务场景，因为效果不好的直接原因可能就是我的提示词使用不当，不断优化提示词后应该能解决，因为问题确实非常简单。

好的，进入正题。

我的笔记本电脑配置很低，没有gpu，所以没有办法选择参数量比较大的模型做本地化部署，先选一个最小的，主要目的是验证一下本地化部署的步骤。

部署内容：

Ollama：Ollama是开源大模型部署或管理工具，提供了对大部分知名模型的支持，对外提供了openAI的api接口、以及聊天窗口
DeepSeek R1 1.5b：选了一个最小的模型，模型文件的大小是1.1GB，关键是推理过程中对GPU没有要求，我16g内存、无显卡的笔记本电脑，可以无障碍运行。
本地知识库搭建：搭建本地rag环境，安装embedding模型实现本地知识库的搭建（这一步还在摸索中，尚未找到合适的embedding模型，所以本次内容不涉及）。

下载安装Ollama

到Ollama官网：https://ollama.com/download 下载：

在这里插入图片描述
直接点击download for windows下载，不需要注册就可以下载。需要点时间，我还是下载了好一会儿的。

下载之后点击OllamaSetup.exe安装，点击安装之后，没有给用户提供参与的机会，直接默认安装到了：

C:\Users\username\AppData\Local\Programs\Ollama

你可以挪地方，比如整体copy到d盘，但是需要设置环境变量，将安装路径加入到path中。

安装deepseek R1

Ollama官网中，点击左上角右侧的models，发现deepseek-r1出现在很显眼的位置：
在这里插入图片描述

打开，选择1.5b，复制安装连接：
在这里插入图片描述
安装之前，需要先配置下环境变量OLLAMA_MODELS，OLLAMA_MODELS是指定Ollama的模型安装位置的：

准备好之后，运行上一步copy的安装命令，开始安装：

ollama run deepseek-r1:1.5b

首次运行，ollama会下载deepseek-r1：
在这里插入图片描述
安装完成后直接启动，在命令行窗口就可以直接使用了。

聊天窗口

Ollama有集成的Open WebUI聊天窗口，网上好多安装教程，这儿就不说了，不是本次研究内容，这次我也没安装。

openAI API调用

很简单，参考文档：
Ollama openai api 调用

python代码：

from openai import OpenAIclient = OpenAI(base_url='http://localhost:11434/v1/',# required but ignoredapi_key='ollama',
)chat_completion = client.chat.completions.create(messages=[{'role': 'user','content': '你好，你是谁，请将一个关于小明的笑话',}],model='deepseek-r1:1.5b',
)
print(chat_completion.choices[0].message.content)

ollama本地安装后默认服务端口是11434，可以通过环境变量OLLAMA_HOST修改。

调试稍稍花了一点时间，是因为model没写对，刚开始写的deepseek-reasoner，调用报错404，之后命令行试了下：

C:\Users\zhang>ollama list
NAME                ID              SIZE      MODIFIED
deepseek-r1:1.5b    a42b25d8c10a    1.1 GB    32 minutes ago

修改model为deepseek-r1:1.5b之后就ok可，调用成功了，但是讲的这个小明的笑话很是操蛋：

<think>
好的，我现在需要帮用户生成一个小明的笑话。首先，我得回想一下小明是个什么样的角色。小明应该是一个可爱的动物，可能从故事里看到他是哪个动物呢？比如兔子、松鼠或者狗之类的。接下来，笑话的核心是什么？一般来说，小明的好奇和困惑会让他的情节有趣。我可以利用这一点来设计谜题或矛盾。让我想想，小明每天都在做什么呢？如果他住在苹果树上，或者他在 garden里，这样的环境可以给他带来乐趣 。比如，他可能想算出苹果的数量或者解决蚂蚁困的难题。接着，我要考虑如何制造一个谜题或者谜语，让小明感到困惑和不安。我可以编一个关于天气的问题，比如“谁 在你的车里？”因为这个答案会让他陷入迷宫般的思考，而不是立刻告诉你答案。然后，我需要确保笑话有趣且容易理解。要让小明感觉困惑而不觉得奇怪，这样他的反应才会是那副可爱的猫头鹰样子。同时，谜题不能太难，保持简单的逻辑就可以了。最后，我要确保整个笑话结构清晰，开头点出小明的特点，接着制造疑问，然后解释答案或者引导到后面的内容。这样既符合用户的指示，又能传达出有趣的笑点。
</think>好的，以下是一个关于小明的笑话：---今天早上，小明刚从花园跑回来，看到花园里有一只受伤的大树被风吹坏了。“哎呀！谁在你的车里？”小明兴奋地指着旁边的一辆黑色轿车。“啊，别急，你就是那只兔子！”小东赶紧冲他微笑，“它经常在你那里偷吃苹果，所以今天 you 害死你。”小明眨了下眼睛，看着旁边的车窗上积了一层薄雾。突然之间，一个温暖的阳光照亮了整辆车。“对不起，请给我一杯饮料？”小明突然开口问道。“不用了，这是我刚才在 garden 发现的一个秘密洞穴。”小东笑着摇摇头，“那里住了一只小蚂蚁，它每天都会 自己结成一堆大面包。”“原来是这样啊！”小明开心地大笑起来，然后从车窗里的阳光中看去。“哦？你什么颜色眼睛？”小明兴奋地问道。“黄色。这就是我，我的新朋友凯特！”小东补充道，“我知道你在 garden 里看到了我们刚才说的苹果，后来那 个苹果树上的苹果都落下来了。”听到这笑语声后，小明忍不住笑了起来，终于找到了内心的平静点！---这样一个可爱的猫头鹰可爱的角色， Plus 这个谜题会让他的笑翻！
PS D:\develop\python\chatBot> & "D:/Program Files/python/python.exe" d:/develop/python/chatBot/base/test.py
<think>
嗯，用户给了我这个请求：“你好，你是谁，请将一个关于小明的笑话。” 我应该先分析一下这个问题。看起来 像是想测试我的知识，可能是在寻求帮助或获取一些信息。首先，“你好，你是谁”这句话本身就是一个常见的问候语，通常不会涉及到笑话。如果我回应“我是DeepSeek-R1-Lite-Preview”，可能会让用户觉得我只是在回答他的名字请求，而不是提供内容。接下来是关于小明的笑话。小明是一个常见的名字，而且中文里有很多关于小孩子的谐音 shorten语，比如“哪 里有我”、“永远抱我对不起你”。如果用户需要一些经典或有趣的笑话，我可以列举一些例子或者建议他找一些 记忆中和这些名字相关的梗。考虑到用户只是想要“一个”关于小明的笑话，我不确定是否有必要提供太多。所以我可能会列出几个常见的笑话来满足他的需求，同时鼓励他多提更多内容，这样我们能够更接近你的实际意图。此外，我也需要考虑用户的其他潜在需求，比如也许他们希望我帮助解答其他类型的提问，或者在写作中使用这个信息。因此，在回复时保持开放和友好的态度是比较好的策略，让用户知道我可以随时回应任何问题，即使是关于笑话的情况。总结一下，我的思考步骤包括：分析用户的问题，判断是否满足问候，检查是否有遗漏的可能内容，然后决定提供合适的回应，鼓励用户提供更多所需的内容。这样的条理确保我能够有效地帮助用户。
</think>你好！我是DeepSeek-R1-Lite-Preview。如果您指的是一个关于小明的笑话，我可以为您提供一些经典的小说梗、动画或儿童领域的梗。比如：        1. **小明遇到大 trouble**：小明在数学题中总是错，最终老师用他爸爸教他的方法纠正了他。
2. **小明的自白**：小明每次都在学校里说话的时候不小心把自己说出来。
3. **小明的搞笑表情和打字机**：- 你看看那个破手机，冲你的笑点喊“开”？让他帮你写个字。
4. **小明小时候喜欢学编程**：- 爸爸问他会不会能算错分数，可他说只要不教别人就好了。
5. **小明的迷路**：小明在放学路上不小心跌了一跤，撞到树上摔在地上。如果您希望一个更具体或针对某个故事的小明梗，请告诉我！

不过这里可以看到deepseek R1作为推理模型的影子，他的回答里有一部分括起来的内容，应该就是他的推理过程，很像其他模型中你用提示词告诉他要用到思维链的回答方式。

下次尝试补充embeding模型的本地化部署，在ollama官网看到了这个：

在这里插入图片描述
这几天找一个靠谱的、资源消耗低的，先研究下。

Thanks！

deep seek R1本地化部署及openAI API调用

下载安装Ollama

安装deepseek R1

聊天窗口

openAI API调用

相关文章：

deep seek R1本地化部署及openAI API调用

力扣第435场周赛讲解

初入机器学习

Signature

93，【1】buuctf web [网鼎杯 2020 朱雀组]phpweb

笔灵ai写作技术浅析（四）：知识图谱

Chromium132 编译指南 - Android 篇（四）：配置 depot_tools

使用真实 Elasticsearch 进行高级集成测试

SQL进阶实战技巧：如何分析浏览到下单各步骤转化率及流失用户数？

机器学习--概览

低代码系统-产品架构案例介绍、炎黄盈动-易鲸云（十二）

Electricity Market Optimization 探索系列（二）

OpenAI 实战进阶教程 - 第一节：OpenAI API 架构与基础调用

TensorFlow简单的线性回归任务

【视频+图文详解】HTML基础4-html标签的基本使用

在Arm芯片苹果Mac系统上通过homebrew安装多版本mysql并解决各种报错，感谢deepseek帮助解决部分问题

c++可变参数详解

【深度分析】DeepSeek 遭暴力破解，攻击 IP 均来自美国，造成影响有多大？有哪些好的防御措施？

CMake项目编译与开源项目目录结构

完全卸载mysql server步骤

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

django filter 统计数量按属性去重

Keil 中设置 STM32 Flash 和 RAM 地址详解

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

Typeerror: cannot read properties of undefined (reading ‘XXX‘)

以光量子为例，详解量子获取方式

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）

【JVM面试篇】高频八股汇总——类加载和类加载器