当前位置：首页 > news >正文

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

news 文章来源：https://blog.csdn.net/ababab12345/article/details/135107203 2025/4/3 15:24:03

ChatGLM3-6B 是一个语言大模型，最近在评估这个模型，但发现它的文档有限，只能从demo代码中猜测调用的参数的含义，准确度是有限的；于是，通过查看源代码来研究，目前整理笔记如下：

ChatGLM3-6B 的调用接口有两个，一个是chat接口，一个是stream_chat接口

接口函数的实现位于代码 chatglm3-6b/blob/main/modeling_chatglm.py中

一、chat接口

chat接口的原型如下：

def chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",max_length: int = 8192, num_beams=1, do_sample=True, top_p=0.8, temperature=0.8, logits_processor=None,**kwargs):

参数说明如下：

参数名	参数含义	默认值
tokenizer	用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
query	str 类型，用户输入的任何文本
history	List[Dict]，可选参数；对话历史，每一项都是一个字典，包含角色（'role'）和内容（'content'）。	None
role	str, 可选参数；输入文本的角色，可以是'user'或者'assistant'。	user
max_length	int, 可选；生成文本的最大长度。	8192
num_beams	int, 可选；Beam搜索的宽度，如果值大于1，则使用Beam搜索	1
do_sample	bool, 可选；是否从预测分布中进行采样，如果为True，则使用采样策略生成回复。	True
top_p	float, 可选；用于控制生成回复的多样性	0.8
temperature	float, 可选；控制生成文本的随机性的参数	0.8
logits_processor	LogitsProcessorList, 可选；用于处理和修改生成步骤中的logits的对象	None
**kwargs	其他传递给模型生成函数的参数

返回值：

response (str): 模型的响应文本。
history (List[Dict]): 更新后的对话历史。

二、stream_chat 接口

流式聊天函数，接受一段文本查询，返回模型的响应。这个函数返回的是一个生成器，可以在流式处理中使用。

该接口函数的原型定义如下：

def stream_chat(self, tokenizer, query: str, history: List[Dict] = None, role: str = "user",past_key_values=None,max_length: int = 8192, do_sample=True, top_p=0.8, temperature=0.8,logits_processor=None, return_past_key_values=False, **kwargs):

参数说明如下：

参数名	参数含义	默认值
tokenizer	用于处理输入和输出文本的tokenizer对象。由前面的 AutoTokenizer.from_pretrained 调用返回的对象
query	str，必须参数；用户输入的任何聊天文本。
history	List[Dict], 可选；对话历史，每一项都是一个字典，包含角色（'role'）和内容（'content'）。	None
role	str, 可选: 输入文本的角色，可以是'user'或者'assistant'。	user
past_key_values	List[Tensor], 可选；用于transformer模型的过去的键值对	None
max_length	int, 可选: 生成文本的最大长度.	8192
do_sample	bool, 可选;是否从预测分布中进行采样	True
top_p	float, 可选: 用于控制生成回复的多样性。	0.8
temperature	float, 可选;控制生成文本的随机性的参数	0.8
logits_processor	LogitsProcessorList, 可选;用于处理和修改生成步骤中的logits的对象。	None
return_past_key_values	bool, 可选): 是否返回过去的键值对，用于下一步的生成。	False
**kwargs	其他传递给模型生成函数的参数。

返回值：

response (str): 模型的响应文本。
history (List[Dict]): 更新后的对话历史。
past_key_values (List[Tensor], 可选): 如果return_past_key_values为True，返回用于下一步生成的过去的键值对。

ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

ChatGLM3-6B 是一个语言大模型，最近在评估这个模型，但发现它的文档有限，只能从demo代码中猜测调用的参数的含义，准确度是有限的；于是，通过查看源代码来研究，目前整理笔记如下： Chat…...

编程日记 2023/12/22 5:23:41

Vuex的学习-2

Vuex的核心概念 StateMutationAction 1.State State提供唯一的公共数据源，所有共享的数据都统一放在Store的State中进行存储。 const store new Vuex.Store({state : { count: 0 } }) 这是渲染的页面组件访问数据的第一种方式组件访问数据的第二种方式 // 1…...

编程日记 2023/12/22 5:21:40

智慧安防视频监控EasyCVR如何通过回调接口向第三方平台推送RTSP视频通道离线通知

安防视频监控系统EasyCVR能在局域网、公网、专网等复杂的网络环境中部署，可支持4G、5G、WiFi、有线等方式进行视频的接入与传输、处理和分发。平台能将接入的视频流进行汇聚、转码、多格式输出和分发，具体包括：RTMP、RTSP、HTTP-FLV、WebSock…...

编程日记 2023/12/22 5:16:35

Scrum项目管理流程及免费敏捷工具

项目启动： 团队明确项目愿景、目标和范围，确定项目范围和优先级，并建立团队以及开展初步计划。制定产品待办事项清单（Product Backlog）： 定义项目所需功能、任务和需求列表，并按优先级排序…...

编程日记 2023/12/22 5:15:34

大型医院PACS系统源码，影像存储与传输系统源码，支持多种图像处理及三维重建功能

PACS系统是医院影像科室中应用的一种系统，主要用于获取、传输、存档和处理医学影像。它通过各种接口，如模拟、DICOM和网络，以数字化的方式将各种医学影像，如核磁共振、CT扫描、超声波等保存起来，并在需要时能够快速调取…...

编程日记 2023/12/22 5:06:27

HDFS NFS Gateway(环境配置，超级详细！！)

HDFS NFS Gateway简介: HDFS NFS Gateway是Hadoop Distributed File System（HDFS）中的一个组件，它允许客户端通过NFS（Network File System，网络文件系统）与HDFS进行交互。具体来说，HDFS NFS…...

编程日记 2023/12/22 5:04:23

nginx 离线安装 https反向代理

这里写自定义目录标题安装步骤1.安装nginx所需依赖1.1 安装gcc和gcc-c1.1.1下载依赖包1.1.2 上传依赖包1.1.3安装依赖 1.2 安装pcre1.2.1 下载pcre1.2.2 上传解压安装包1.2.3 编译安装 1.3 下载安装zlib1.3.1 下载zlib1.3.2 上传解压安装包1.3.3 编译安装 1.4 下载安装openssl…...

编程日记 2023/12/22 4:59:19

Linux Centos 配置 Docker 国内镜像加速

在使用 Docker 进行容器化部署时，由于国外的 Docker 镜像源速度较慢，我们可以配置 Docker 使用国内的镜像加速器，以提高下载和部署的效率。本文将介绍如何在 CentOS 系统上配置 Docker 使用国内镜像加速。步骤一：安装 Docker 首…...

编程日记 2023/12/22 4:58:18

中心下标-----来自力扣

本题使用go语言完成： 思路：1.先求出整个数组的和 2.用一个循环整个和减去左和看是否等于右和，如果等于，返回索引下标寻找数组的中心索引给你一个整数数组 nums ，请计算数组的中心下标。数组中心下标是数组的一…...

编程日记 2023/12/22 4:55:15

手写单链表（指针）（next域）附图

目录创建文件： 具体实现： 首先是头插。注意：一定要注意：再定义tmp时，要给它赋一个初始值（推荐使用 new list_next) 接着是尾插： 随后是中间插： 然后是最简单的改值&#xf…...

编程日记 2023/12/22 4:51:12

关于with torch.no_grad:的一些小问题

with torch.no_grad:是截断梯度记录的，新生成的数据的都不记录梯度，但是今天产生了一点小疑惑，如果存在多层函数嵌入，是不是函数内所有的数据都不记录梯度，验证了一下，确实是的。 import torch x torch.r…...

编程日记 2023/12/22 4:45:06

大创项目推荐深度学习机器视觉人脸识别系统 - opencv python

文章目录 0 前言1 机器学习-人脸识别过程人脸检测人脸对其人脸特征向量化人脸识别 2 深度学习-人脸识别过程人脸检测人脸识别Metric Larning 3 最后 0 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 深度学习机器视觉人脸识别系统该项目…...

编程日记 2023/12/22 4:44:05

【PostGIS】空间数据库-常用空间函数

记录一些常用的空间函数： 1、转换函数在几何图形和外部数据格式之间进行转换的函数。 -- 将文本表示转换为几何类型 -- 结果：0101000000000000000000F03F000000000000F03F SELECT st_geomfromtext(point(1 1),0);-- 将几何类型转换为文本表示 -- 结果…...

编程日记 2023/12/22 4:35:57

程序员的50大JVM面试问题及答案

文章目录 1.JDK、JRE、JVM关系？2.启动程序如何查看加载了哪些类，以及加载顺序？3. class字节码文件10个主要组成部分?4.画一下jvm内存结构图？5.程序计数器6.Java虚拟机栈7.本地方法栈8.Java堆9.方法区10.运行时常量池？…...

编程日记 2023/12/22 4:31:54

架构设计系列之前端架构和后端架构的区别和联系

前端架构和后端架构都是软件系统中最关键的架构层，负责处理不同方面的任务和逻辑，两者之间是存在一些区别和联系的，我会从以下几个方面来阐述： 一、定位和职责前端架构主要关注用户界面和用户体验，负责处理用户与…...

编程日记 2023/12/22 4:26:50

UE5 水材质注意要点

1、两个法线反向交替流动，可以去观感假的现象 2、水面延边的透明度低 3、增加水面延边的浪花 4、增加折射折射要整体质量至少在High才有效果改为半透明材质没有法线信息？ 5、处理反射效果勾选为true 找到这个放在水域勾为false，即可有非…...

编程日记 2023/12/22 4:25:49

数据安全扫描仪荣膺网络安全优秀创新成果大赛优胜奖 - 凸显多重优势

近日，由中国网络安全产业联盟（CCIA）主办、CCI数据安全工作委员会中国电子技术标准化研究院等单位承办的“2023年网络安全优秀创新成果大赛”获奖名单公布。天空卫士数据安全扫描仪（DSS）产品获得创新成果大赛优胜奖。本…...

编程日记 2023/12/22 4:24:48

数据结构学习 leetcode64最小路径和

动态规划题目： 建议看这里，有这道题详细的解析。我觉得写的挺好。这是我在学动态规划的时候，动手做的一道题。虽然我在学动态规划，但是我之前学了dps，所以我就想先用dps试着做，结果发现不行&#xf…...

编程日记 2023/12/22 4:21:46

导出（导入）Linux虚拟机并修改IP地址

一、导出虚拟机说明：先关闭虚拟机，然后再进行导出。步骤1：选择要导出的虚拟机步骤2：选择文件菜单栏下的导出为OVF文件。步骤3：将导出的文件保存至硬盘文件夹。二、导入虚拟机步骤1：选择文件菜单栏…...

编程日记 2023/12/22 4:16:42

OpenCV4工业缺陷检测的六种方法

👨‍🎓博主简介 🏅云计算领域优质创作者 🏅华为云开发者社区专家博主 🏅阿里云开发者社区专家博主 💊交流社区：运维交流社区欢迎大家的加入！ 🐋 希望大家多多支…...

编程日记 2023/12/22 4:14:41

ICC2：Less than minimum edge length和Concave convex edge enclosure

我正在「拾陆楼」和朋友们讨论有趣的话题，你⼀起来吧？拾陆楼知识星球入口首先，要介绍一下这两种drc Less than minimum edge length对应的tf rule如下: 而Concave convex edge enclosure对应图示和tf 规则如下，可...

编程日记 2023/12/22 4:13:40

RouterSrv-DHCP

2023年全国网络系统管理赛项真题模块B-Windows解析题目安装和配置DHCP relay服务，为办公区域网络提供地址上网。DHCP服务器位于AppSrv服务器上。拆分DHCP服务器上的作用域，拆分的百分比为7:3。InsideCli优先从RouterSrv获取地址。配置步骤安装和配置DHCP relay服务，为办…...

编程日记 2023/12/22 4:11:38

【人生苦短，我学 Python】（8）文件的读写和过滤器

目录简述 / 前言1. 文件的操作2. 过滤器2.1 more —— 逐屏显示数据2.2 sort —— 排序2.3 more 和 sort 一起用文章传送门简述 / 前言上一篇我们介绍了 Python 的输入（input）和输出（print），以及如何通过命令行给…...

编程日记 2023/12/22 4:10:38

智能优化算法应用：基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码文章目录智能优化算法应用：基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.饥饿游戏算法4.实验参数设定5.算法结果6.…...

编程日记 2023/12/22 4:09:37

leetCode算法—10. 正则表达式匹配

10.给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。难度：困难 *** 给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。 ‘.’ 匹配任意单个字符 ‘*’ 匹…...

编程日记 2023/12/22 4:07:35

Android Studio 实现音乐播放器

目录一、引言视频效果展示： 1.启动页效果 2.登录页效果 3.注册页效果 4.歌曲列表页效果 5.播放页效果二、详细设计 1.登陆注册功能 2.音乐列表页面 2.音乐播放功能三、源码获取一、引言 Android初学者开发第一个完整的实例项目应该就属《音乐播放器…...

编程日记 2023/12/22 4:02:30

端口占用命令 netstat (centos)+netstat (windows)

linux 1.使用 netstat 命令查看端口占用情况 netstat -tlnp 使用 -p 选项查看进程信息。使用 -t 选项列出 TCP 协议的连接：类似（使用 -u 选项列出 UDP 协议的连接：） 2.查找占用指定端口号的应用信息 netstat -tlnp | grep 3…...

编程日记 2023/12/22 3:59:28

Python-基于fastapi实现SSE流式返回（类似GPT）

最近在做大模型对话相关功能，需要将对话内容流式返回给前端页面（类似GPT的效果）。下面直接说下如何实现： 1.首先导入fastapi和sse流式返回所需要的包 from fastapi import APIRouter, Response, status from sse_starlette.sse …...

编程日记 2023/12/22 3:51:21

iOS中宿主APP与录屏扩展进程数据传递方式

背景在iOS生态系统中，应用程序的功能不再局限于单一的宿主应用，而是可以通过扩展进程实现更丰富的用户体验和功能。其中一种引人注目的扩展是录屏功能，它使用户能够捕捉设备屏幕上的活动，无论是游戏过程、教育演示还是其他应用场…...

编程日记 2023/12/22 3:48:18

Windows系统下的可用RADIUS软件-[资源]

RADIUS协议相关原理介绍，可参考博客RADIUS协议原理介绍报文分析配置指导-RFC2865/RFC2866。本文用于提供和介绍Window系统下几种可用的RADIUS软件。主要涉及软件有radius_ping（绿色免安装版）和WinRadius（绿色免安装版&#xff09…...

编程日记 2023/12/22 3:39:10

一、chat接口

二、stream_chat 接口

相关文章：