当前位置：首页 > news >正文

【LLM】二、python调用本地的ollama部署的大模型

news 2026/2/10 0:27:23

系列文章目录

往期文章：

【LLM】一、利用ollama本地部署大模型

文章目录

前言

一、ollama库调用

二、langchain调用

三、requests调用

四、相关参数说明：

总结

前言

本地部署了大模型，下一步任务便是如何调用的问题，实际场景中个人感觉用http请求的方式较为合理，本篇文章也将通过http请求的方式来调用我们本地部署的大模型，正文开始。

一、ollama库调用

参考文档：ollama的python库调用

注意，这里的ollama不是我们第一篇安装的那个Ollama！！！！不要搞混

1、环境准备：

pip install ollama

2、调用示例：

如果你都是按照默认设置安装的Ollama，即host和port等均未设置，那执行以下代码即可

import ollama
res=ollama.chat(model="phi3",stream=False,messages=[{"role": "user","content": "你是谁"}],options={"temperature":0})
print(res)

返回结果如：

如果你更改了Ollama的配置，比如更改了监听端口，则执行下边代码：

import ollamahost="xxx"
port="xxx"
client= ollama.Client(host=f"http://{host}:{port}")
res=client.chat(model="qwen2:1.5b",messages=[{"role": "user","content": "你是谁"}],options={"temperature":0})print(res)

返回结果如：

其中，host和port改为你自己的即可

二、langchain调用

参考链接：langchain调用ollama

1、安装依赖：

pip install langchain
pip install langchain_community

2、调用示例

from langchain_community.llms import Ollama
host="xxx"
port="xxx" #默认的端口号为11434
llm=Ollama(base_url=f"http://{host}:{port}", model="qwen2:1.5b",temperature=0)
res=llm.invoke("你是谁")
print(res)

其中，host和port改为你自己的即可

结果如：

三、requests调用

1、安装依赖

pip install requests

2、调用示例

host="xxx"
port="xxx"
url = f"http://{host}:{port}/api/chat"
model = "qwen2:1.5b"
headers = {"Content-Type": "application/json"}
data = {"model": model, #模型选择"options": {"temperature": 0.  #为0表示不让模型自由发挥，输出结果相对较固定，>0的话，输出的结果会比较放飞自我},"stream": False, #流式输出"messages": [{"role": "system","content":"你是谁？"}] #对话列表}
response=requests.post(url,json=data,headers=headers,timeout=60)
res=response.json()
print(res)

其中，host和port改为你自己的即可，结果同上

四、相关参数说明：

上述几个调用方式中所涉及到的比较重要的参数介绍如下：

temperature：用于调整生成结果的创造性程度，设置越高，生成的文本越新颖、越独特，设置越低，结果更集中
stream：默认false,是否流式传输回部分进度。
format: 转录输出的格式，可选项包括json、str等。

总结

以上就是本篇的全部内容，如有问题，环境评论区交流，或+企鹅群：995760755交流；如觉得有用，欢迎三连

【LLM】二、python调用本地的ollama部署的大模型

系列文章目录往期文章： 【LLM】一、利用ollama本地部署大模型目录文章目录前言一、ollama库调用二、langchain调用三、requests调用四、相关参数说明： 总结前言本地部署了大模型，下一步任务便是如何调用的问题&#xff0c…...

编程日记 2024/7/9 4:35:43

20240708 每日AI必读资讯

🤖破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍 - 谷歌DeepMind研究团队提出了一种加快AI训练的新方法——多模态对比学习与联合示例选择（JEST），大大减少了所需的计算资源和时间。 - JE…...

编程日记 2024/7/9 4:34:42

为什么KV Cache只需缓存K矩阵和V矩阵，无需缓存Q矩阵？

大家都知道大模型是通过语言序列预测下一个词的概率。假定{ x 1 x_1 x1， x 2 x_2 x2， x 3 x_3 x3，…， x n − 1 x_{n-1} xn−1}为已知序列，其中 x 1 x_1 x1， x 2 x_2 x2， x 3 x_3 x…...

编程日记 2024/7/9 4:33:40

VS code修改底部的行号的状态栏颜色

VSCode截图相信很多小伙伴被底部的蓝色状态栏困扰很久了处理的方式有两种： 1、隐藏状态栏 2、修改其背景颜色第一种方法大伙都会，今天就使用第二种方法。 1、点击齿轮进入setting 2、我现在用的新版本，设置不是以前那种json格式展示&…...

编程日记 2024/7/9 4:32:39

【鸿蒙学习笔记】MVVM模式

官方文档：MVVM模式 [Q&A] 什么是MVVM ArkUI采取MVVM Model View ViewModel模式。 Model层：存储数据和相关逻辑的模型。View层：在ArkUI中通常是Component装饰组件渲染的UI。ViewModel层：在ArkUI中，ViewModel是…...

编程日记 2024/7/9 4:30:36

端、边、云三级算力网络

目录端、边、云三级算力网络 NPU Arm架构 OpenStack kubernetes k3s轻量级Kubernetes kubernetes和docker区别 DCI(Data Center Interconnect) SD/WAN TF 端、边、云三级算力网络算力网络从传统云网融合的角度出发，结合边缘计算、网络云化以及智能控制的优势，通…...

编程日记 2024/7/9 4:27:30

java —— JSP 技术

一、JSP （一）前言 1、.jsp 与 .html 一样属于前端内容，创建在 WebContent 之下； 2、嵌套的 java 语句放置在<% %>里面； 3、嵌套 java 语句的三种语法： ① 脚本：<% java 代码 %>…...

编程日记 2024/7/9 4:26:29

【Python学习笔记】菜鸟教程Scrapy案例 + B站amazon案例视频

背景前摇（省流可以跳过这部分） 实习的时候厚脸皮请教了一位办公室负责做爬虫这块的老师，给我推荐了Scrapy框架。我之前学过一些爬虫基础，但是用的是比较常见的BeautifulSoup和Request，于是得到Scrapy这个关键词后&am…...

编程日记 2024/7/9 4:24:24

Pycharm的终端（Terminal）中切换到当前项目所在的虚拟环境

1.在Pycharm最下端点击终端/Terminal, 2.点击终端窗口最上端最右边的∨， 3.点击Command Prompt，切换环境， 可以看到现在环境已经由默认的PS(Window PowerShell)切换为项目所使用的虚拟环境。 4.更近一步，如果想让Pycharm默认显示…...

编程日记 2024/7/9 4:23:23

Nginx 高效加速策略：动静分离与缓存详解

在现代Web开发中，网站性能是衡量用户体验的关键指标之一。Nginx，以其出色的性能和灵活性，成为众多网站架构中不可或缺的一部分。本文将深度解析如何利用Nginx实现动静分离与缓存，从而大幅提升网站加载速度和响应效率。理解动静分…...

编程日记 2024/7/9 4:22:20

Unity3D 游戏摇杆的制作与实现详解

在Unity3D游戏开发中，摇杆是一种非常常见的输入方式，特别适用于移动设备的游戏控制。本文将详细介绍如何在Unity3D中制作和实现一个虚拟摇杆，包括技术详解和代码实现。对惹，这里有一个游戏开发交流小组，大家可以点击…...

编程日记 2024/7/9 4:18:14

从nginx返回404来看http1.0和http1.1的区别

序言什么样的人可以称之为有智慧的人呢？如果下一个定义，你会如何来定义？ 所谓智慧，就是能区分自己能改变的部分，自己无法改变的部分，努力去做自己能改变的，而不要天天想着那些无法改变的东西&a…...

编程日记 2024/7/9 4:14:09

MySQL 代理层：ProxySQL

文章目录说明安装部署1.1 yum 安装1.2 启停管理1.3 查询版本1.4 Admin 管理接口入门体验功能介绍3.1 多层次配置系统读写分离将实例接入到代理服务定义主机组之间的复制关系配置路由规则事务读的配置延迟阈值和请求转发 ProxySQL 核心表mysql_usersmysql_serversmysql_repli…...

编程日记 2024/7/9 4:13:07

异步主从复制

主从复制的概念主从复制是一种在数据库系统中常用的数据备份和读取扩展技术，通过将一个数据库服务器（主服务器）上的数据变更自动同步到一个或多个数据库服务器（从服务器）上，以此来实现数据的冗余备份、读…...

编程日记 2024/7/9 4:12:06

论文解析——Full Stack Optimization of Transformer Inference: a Survey

作者及发刊详情摘要正文主要工作贡献这篇文章的贡献主要有两部分： 分析Transformer的特征，调查高效transformer推理的方法通过应用方法学展现一个DNN加速器生成器Gemmini的case研究 1）分析和解析Transformer架构的运行时特性和瓶颈…...

编程日记 2024/7/9 4:11:05

selenium处理cookie问题实战

1. cookie获取不完整需要进入的资损平台(web)首页，才会出现有效的ctoken等信息 1.1. 原因说明未进入指定页面而获取的 cookie 与进入页面后获取的 cookie 可能会有一些差异，这取决于网站的具体实现和 cookie 的设置方式。通常情况下，一些…...

编程日记 2024/7/9 4:06:59

(十五)GLM库对矩阵操作

GLM简单使用 glm是一个开源的对矩阵运算的库，下载地址： https://github.com/g-truc/glm/releases 直接包含其头文件即可使用： #include <glad/glad.h>//glad必须在glfw头文件之前包含 #include <GLFW/glfw3.h> #include <io…...

编程日记 2024/7/9 4:05:58

android中activity与fragment之间的各种跳转

我们以音乐播放、视频播放、用户注册与登录为例【Musicfragment（音乐列表页）、Videofragment（视频列表页）、MusicAvtivity（音乐详情页）、VideoFragment（视频详情页）、LoginActivity&…...

编程日记 2024/7/9 4:04:56

动态规划算法-以中学排课管理系统为例

1.动态规划算法介绍 1.算法思路动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中，可能会有许多可行解。每一个解都对应于一个值，我们希望找到具有最优值的解。动态规划算法与分治法类似，其基本思想也是将待求解问题分解成若…...

编程日记 2024/7/9 4:03:55

本安防爆手机：危险环境下的安全通信解决方案

在石油化工、煤矿、天然气等危险环境中，通信安全是保障工作人员生命安全和生产顺利进行的关键。防爆智能手机作为专为这些环境设计的通信工具，提供了全方位的安全通信解决方案。防爆设计与材料： 防爆智能手机采用特殊的防爆结构和材料&…...

编程日记 2024/7/9 4:02:54

【网络】每天掌握一个Linux命令 - iftop

在Linux系统中，iftop是网络管理的得力助手，能实时监控网络流量、连接情况等，帮助排查网络异常。接下来从多方面详细介绍它。目录【网络】每天掌握一个Linux命令 - iftop工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景…...

编程新知 2025/10/10 17:03:53

R语言AI模型部署方案：精准离线运行详解

R语言AI模型部署方案：精准离线运行详解一、项目概述本文将构建一个完整的R语言AI部署解决方案，实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点： 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...

编程新知 2025/12/6 1:56:35

Swift 协议扩展精进之路：解决 CoreData 托管实体子类的类型不匹配问题（下）

概述在 Swift 开发语言中，各位秃头小码农们可以充分利用语法本身所带来的便利去劈荆斩棘。我们还可以恣意利用泛型、协议关联类型和协议扩展来进一步简化和优化我们复杂的代码需求。不过，在涉及到多个子类派生于基类进行多态模拟的场景下，…...

编程新知 2026/1/23 4:56:05

3.8 记事本项目总结项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

编程新知 2026/2/1 6:56:36

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试，通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小，增大可提高计算复杂度duration: 测试持续时间（秒&…...

编程新知 2025/12/7 12:35:20

JDK 17 新特性

#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持，不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的&#xff…...

编程新知 2026/1/29 5:34:29

【HTTP三个基础问题】

面试官您好！HTTP是超文本传输协议，是互联网上客户端和服务器之间传输超文本数据（比如文字、图片、音频、视频等）的核心协议，当前互联网应用最广泛的版本是HTTP1.1，它基于经典的C/S模型，也就是客…...

编程新知 2025/12/10 6:18:55

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述企业和个人都在尝试各种AI，使用客户端或是内部自己搭建集成大模型的终端，加速与大型语言模型（LLM）的结合，同时使用检索增强生成（Retrieval Augmented Generation &#…...

编程新知 2026/2/9 20:30:28

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征封装性： 隐藏字段的实现细节提供对字段的受控访问访问控制： 可单独设置get/set访问器的可见性可创建只读或只写属性计算属性： 可以在getter中执行计算逻辑不需要直接对应一个字段验证逻辑： 可以…...

编程新知 2025/12/4 0:13:33

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题问题现象当开发者预期进行浮点除法却误用整数除法时，会出现小数部分被截断的情况。典型错误模式如下： void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

编程新知 2026/2/4 13:10:38

【LLM】二、python调用本地的ollama部署的大模型

系列文章目录

前言

一、ollama库调用

二、langchain调用

三、requests调用

四、相关参数说明：

总结

相关文章：

【LLM】二、python调用本地的ollama部署的大模型

20240708 每日AI必读资讯

为什么KV Cache只需缓存K矩阵和V矩阵，无需缓存Q矩阵？

VS code修改底部的行号的状态栏颜色

【鸿蒙学习笔记】MVVM模式

端、边、云三级算力网络

java —— JSP 技术

【Python学习笔记】菜鸟教程Scrapy案例 + B站amazon案例视频

Pycharm的终端（Terminal）中切换到当前项目所在的虚拟环境

Nginx 高效加速策略：动静分离与缓存详解

Unity3D 游戏摇杆的制作与实现详解

从nginx返回404来看http1.0和http1.1的区别

MySQL 代理层：ProxySQL

异步主从复制

论文解析——Full Stack Optimization of Transformer Inference: a Survey

selenium处理cookie问题实战

(十五)GLM库对矩阵操作

android中activity与fragment之间的各种跳转

动态规划算法-以中学排课管理系统为例

本安防爆手机：危险环境下的安全通信解决方案

【网络】每天掌握一个Linux命令 - iftop

R语言AI模型部署方案：精准离线运行详解

Swift 协议扩展精进之路：解决 CoreData 托管实体子类的类型不匹配问题（下）

P3 QT项目----记事本（3.8）

拉力测试cuda pytorch 把 4070显卡拉满

JDK 17 新特性

【HTTP三个基础问题】

10-Oracle 23 ai Vector Search 概述和参数

C#中的CLR属性、依赖属性与附加属性

Java数值运算常见陷阱与规避方法