当前位置：首页 > news >正文

【大模型】Vllm基础学习

news 文章来源：https://blog.csdn.net/idiotyi/article/details/139991011 2024/7/6 17:35:19

前言：vllm是一个大语言模型高速推理框架，旨在提高大模型的服务效率。优势是内存管理，实现的核心是pageattetion算法。仅在gpu上加速，不在cpu加速。

1. PageAttention

核心思想：将每个序列的KV cache（键值缓存）分块处理，每块包含固定数量的token。
灵感来源：操作系统中的虚拟内存和分页管理技术，旨在动态地为请求分配KV cache显存，提升显存利用率
评估结果：vLLM可以将常用的LLM吞吐量提高了2-4倍

2. 实践

2.1 安装

 pip install vllm

2.2 离线推理

示例一

from vllm import llmllm = LLM("facebook/opt-13b", tensor_parallel_size=4)
output = llm.generate("San Franciso is a")

示例二

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams# Initialize the tokenizer
tokenizer = AutoTokenizer.from_pretrained("/data/weisx/model/Qwen1.5-4B-Chat")# Pass the default decoding hyperparameters of Qwen1.5-4B-Chat
# max_tokens is for the maximum length for generation.
sampling_params = SamplingParams(temperature=0.7, top_p=0.8, repetition_penalty=1.05, max_tokens=512)# Input the model name or path. Can be GPTQ or AWQ models.
llm = LLM(model="Qwen/l/Qwen1.5-4B-Chat", trust_remote_code=True)# Prepare your prompts
prompt = "Tell me something about large language models."
messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)# generate outputs
outputs = llm.generate([text], sampling_params)# Print the outputs.
for output in outputs:prompt = output.promptgenerated_text = output.outputs[0].textprint(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")

SamplingParams：在VLLM模型中主要负责调整采样过程。采样是在模型生成文本或其他类型输出时的一个关键步骤，它决定了模型如何从可能的输出中选择一个。
LLM的参数model是模型名，还可以输入其他大语言模型，但要注意不是所有的llm都被vllm支持。
message中定义了系统的角色内容以及用户的角色内容

2.3 适配OpenAI的api

a. 命令行输入

python -m vllm.entrypoints.openai.api_server --model your_model_path --trust-remote-code

默认监听 8000 端口，–host 和–port 参数可以指定主机和端口。
b. 使用curl与Qwen对接(命令行)

curl http://localhost:8000/generate \-d '{"prompt": "San Francisco is a","use_beam_search": true,"n": 4,"temperature": 0}'

http://localhost:8000/generate是访问的http地址，也就是客户端地址
-d后面跟的是参数，可以根据需求配置不同的参数

c. 使用python和Qwen对接

from openai import OpenAI
# Set OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)chat_response = client.chat.completions.create(model="Qwen/Qwen1.5-4B-Chat",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Tell me something about large language models."},]
)
print("Chat response:", chat_response)

【大模型】Vllm基础学习

前言：vllm是一个大语言模型高速推理框架，旨在提高大模型的服务效率。优势是内存管理，实现的核心是pageattetion算法。仅在gpu上加速，不在cpu加速。目录 1. PageAttention2. 实践2.1 安装2.2 离线推理2.3 适配OpenAI的api 1. Page…...

编程日记 2024/7/3 3:17:17

使用vue动态给同一个a标签添加内容并给a标签设置hover，悬浮文字变色，结果鼠标悬浮有的字上面不变色

如果Vue的虚拟DOM更新机制导致样式更新不及时，你可以尝试以下几种方法来解决这个问题： 确保使用响应式数据： 确保你使用的数据是响应式的，并且任何对这些数据的更改都会触发视图的更新。在Vue中，你应该使用data对象中的…...

编程日记 2024/7/3 3:16:15

【ajax实战06】进行文章发布

本文章目标：收集文章内容，并提交服务器保存一：基于form-serialize插件收集表单数据 form-serialize插件仅能收集到表单数据，除此之外的数据无法收集到二：基于axios提交到服务器保存三：调用alert警告…...

编程日记 2024/7/3 3:15:13

Codeforces Round 954 (Div. 3)（A~E）

目录 A. X Axis B. Matrix Stabilization C. Update Queries D. Mathematical Problem A. X Axis Problem - A - Codeforces 直接找到第二大的数，答案就是这个数与其他两个数的差值的和。 void solve() {vector<ll>a;for (int i 1; i < 3; i){int x;…...

编程日记 2024/7/3 3:14:12

基于Java微信小程序同城家政服务系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍：✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者，博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来，还…...

编程日记 2024/7/3 3:13:11

[21] Opencv_CUDA应用之使用Haar级联的对象检测

Opencv_CUDA应用之使用Haar级联的对象检测 Haar级联使用矩形特征来检测对象，它使用不同大小的矩形来计算不同的线和边缘特征。矩形包含一些黑色和白色区域，如下图所示，它们在图像的不同位置居中类Haar特征检测算法的思想是计算矩形内白色像素和黑色像素之间的差异这个方法的…...

编程日记 2024/7/3 3:12:10

CXL：拯救NVMe SSD缓存不足设计难题-2

LMB提出了基于CXL协议的内存扩展框架和内核模块。该方案利用CXL内存扩展器作为物理DRAM源，旨在提供一个统一的内存分配接口，使PCIe和CXL设备都能方便地访问扩展的内存资源。通过这个接口，NVMe驱动和CUDA的统一内存内核驱动可以直接高效地访问…...

编程日记 2024/7/3 3:08:05

Opencv学习项目6——pyzbar

在之前我们学习了解码图片中的二维码，这次我们开启摄像头来解码视频中二维码开启摄像头 # 打开摄像头 cap cv2.VideoCapture(0) cap.set(3, 640) # 设置摄像头画面宽度 cap.set(4, 480) # 设置摄像头画面高度我使用的是笔记本上的摄像头来进行的，…...

编程日记 2024/7/3 3:07:03

Switch 刷安卓11 (LineageOS 18.1) 大气层双系统图文教程

很多朋友手上已经拥有了完成硬破的 Switch ，但又不甘心仅仅使用 Switch 本身的地平线系统，Switch 刷安卓 (Android 11) 会是一个好的选择，虽然 Switch 的 CPU 性能拉跨，但和桌面平台同一设计思路的TegraX1 GPU 可谓是先于时代&…...

编程日记 2024/7/3 3:05:01

Spring Boot与Spring Batch的深度集成

Spring Boot与Spring Batch的深度集成大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天我们将深入探讨在Spring Boot应用中如何实现与Spring Batch的深度集成…...

编程日记 2024/7/3 3:01:57

RTSP协议在视频监控系统中的典型应用、以及视频监控设备的rtsp地址格式介绍

目录一、协议概述 1、定义 2、提交者 3、位置二、主要特点 1、实时性 2、可扩展性 3、控制功能 4、回放支持 5、网络适应性三、RTSP的工作原理 1、会话准备 2、会话建立 3、媒体流控制 4、会话终止 5、媒体数据传输四、协议功能 1、双向性 2、带外协议 …...

编程日记 2024/7/3 2:59:55

Kotlin基础——异步和并发

同步和异步同步指的是一种行为：当执行IO操作的时候，在代码层面上我们需要主动去等待结果，直到结果返回阻塞指的是一种状态：当执行IO操作的时候，线程处于挂起状态，就是该线程没有执行了故同步不是阻塞&a…...

编程日记 2024/7/3 2:58:53

消防认证-防火卷帘

一、消防认证消防认证是指消防产品符合国家相关技术要求和标准，且通过了国家认证认可监督管理委员会审批，获得消防认证资质的认证机构颁发的证书，消防产品具有完好的防火功能，是住房和城乡建设领域验收的重要指标。二、认证依据…...

编程日记 2024/7/3 2:57:52

SpringBoot3.3集成knif4j-swagger文档方式和使用案例

springboot3 集成 knif4j ： 访问地址： swagger 接口文档默认地址：http://localhost:8080/swagger-ui.html# Knife4j 接口文档默认地址：http://127.0.0.1:8080/doc.html Maven: <dependency><groupId>com.github.x…...

编程日记 2024/7/3 2:56:51

老年服务与管理实训室：制定教学模式

随着我国人口老龄化程度的加深,如何为老年人提供优质的养老服务成为社会关注的重点。作为培养老年服务人才的重要阵地,老年服务与管理实训室应制定科学合理的教学模式,满足行业发展需求,培养出高素质的老年服务专业人才。本文针对老年服务与管理实训室的教学模式展开探讨,提出相…...

编程日记 2024/7/3 2:54:48

4、DDD、中台和微服务的关系

DDD、中台和微服务的关系 1 DDD和中台的本质领域驱动设计（DDD）和中台在企业架构中有着密切的关系。DDD的本质在于通过对业务领域的深入分析和建模，构建高内聚、低耦合的系统。而中台则是对企业核心业务能力的抽象和封装，以实现…...

编程日记 2024/7/3 2:51:45

【ACM出版，马来西亚-吉隆坡举行】第四届互联网技术与教育信息化国际会议 (ITEI 2024)

作为全球科技创新大趋势的引领者，中国不断营造更加开放的科技创新环境，不断提升学术合作的深度和广度，构建惠及各方的创新共同体。这是对全球化的新贡献，是构建人类命运共同体的新贡献。第四届互联网技术与教育信息化国际学术会议…...

编程日记 2024/7/3 2:50:43

走进IT的世界

引言随着高考的结束，对于即将踏入IT（信息技术）领域的新生而言，这个假期不仅是放松身心的时间，更是提前规划、深化专业知识、为大学生活奠定坚实基础的宝贵机会。以下是一份详尽的高考假期预习与规划指南，…...

编程日记 2024/7/3 2:47:40

Linux 时区文件编译器 zic【man 8 zic】

1. NAME（名） zic - 时区编译器 2. SYNOPSIS（概要） zic [-v] [-d directory] [-l localtime] [-p posixrules] [-L leapsecondfilename] [-s] [-y command] [filename ...]3. DESCRIPTION（函数描述） zic…...

编程日记 2024/7/3 2:46:39

Springboot下使用Redis管道(pipeline)进行批量操作

之前有业务场景需要批量插入数据到Redis中，做的过程中也有一些感悟，因此记录下来，以防忘记。下面的内容会涉及到分别使用for、管道处理批量操作，比较其所花费时间。分别使用RedisCallback、SessionCallback进行Redis pipeline …...

编程日记 2024/7/3 2:45:37

Vue技巧大揭秘：自定义指令的力量与应用

引言自定义指令就像是给予开发者的一把魔法钥匙，它能够打开DOM操作的新世界，按我的理解就是把对DOM操作的逻辑进行封装全局注册与局部注册全局注册定义： 全局注册意味着自定义指令在Vue实例创建之前通过Vue.directive()方法注册&…...

编程日记 2024/7/3 2:44:35

HR人才测评，如何考察想象力？

什么是想象力？ 想象力是指，人们通过在已有物质的基础上，通过大脑想象、加工、创造出新事物的能力，举一个非常简单的例子，在提到鸟这种生活的时候，大家会联想到各种各样不同鸟的品种。在企业招聘中常常应…...

编程日记 2024/7/3 2:43:34

Git命令远程分支的合并和本地分支的同步

天行健，君子以自强不息；地势坤，君子以厚德载物。每个人都有惰性，但不断学习是好好生活的根本，共勉！ 文章均为学习整理笔记，分享记录为主，如有错误请指正，共同学习进步。…...

编程日记 2024/7/3 2:42:33

墨烯的C语言技术栈-C语言基础-003

三.数据类型 1.char // 字符数据型 2.short // 短整型 3.int // 整型 4.long // 长整型 5.long long // 更长的整型 6.float // 单精度浮点数 7.double // 双精度浮点数为什么写代码? 为了解决生活中的问题购物,点餐,看电影为什么有这么多类型呢? 因为说的话都是字符型…...

编程日记 2024/7/3 2:41:32

RpcRrovider分发rpc服务(OnMessage和Closure回调)

目录 1.完善rpcprovider.cc的OnConnection 2.完善rpcprovider.cc的OnMessage 3.完整rpcprovider.h 4.完整rpcprovider.cc 这篇文章主要完成，protobuf实现的数据序列化和反序列化。 1.完善rpcprovider.cc的OnConnection rpc的请求是短连接的，请求一次…...

编程日记 2024/7/3 2:40:30

分解+降维+预测！多重创新！直接写核心！EMD-KPCA-Transformer多变量时间序列光伏功率预测

分解降维预测！多重创新！直接写核心！EMD-KPCA-Transformer多变量时间序列光伏功率预测目录分解降维预测！多重创新！直接写核心！EMD-KPCA-Transformer多变量时间序列光伏功率预测效果一览基本介绍程序设计参…...

编程日记 2024/7/3 2:36:24

【Python】MacBook M系列芯片Anaconda下载Pytorch，并开发一个简单的数字识别代码（附带踩坑记录）

文章目录配置镜像源下载Pytorch验证使用Pytorch进行数字识别配置镜像源 Anaconda下载完毕之后，有两种方式下载pytorch，一种是用页面可视化的方式去下载，另一种方式就是直接用命令行工具去下载。但是由于默认的Anaconda走的是外网&#x…...

编程日记 2024/7/3 2:35:22

自定义控件动画篇（四）ObjectAnimator的使用

ObjectAnimator 是 Android 属性动画框架中的一个重要组件，它允许你针对特定属性的值进行动画处理。与 ValueAnimator 相比，ObjectAnimator 更专注于 UI 组件，可以直接作用于视图的属性，如位置、尺寸、透明度等，而无需…...

编程日记 2024/7/3 2:34:21

实现List接口的ArrayList和LinkedList

package study;import java.util.*;public class day01_list {public static void main(String[] args) {// <Integer> 这个尖括号表示的是 Java 的泛型（Generics）// 泛型是 Java 5 引入的一项特性，它允许你在类、接口和方法中使用类…...

编程日记 2024/7/3 2:32:19

下拉选择输入框(基于elment-ui)

最近在需求中，需要有一个下拉选择功能，又得可以输入，在 element-ui 官网找了，发现没有适合的，然后在修炼 cv 大法的我，也在网上看了一下，但是也都感觉不合适，所以就自己写了两个&…...

编程日记 2024/7/3 2:31:17

CPP入门：日期类的构建

目录 1.日期类的成员 2.日期类的成员函数 2.1构造和析构函数 2.2检查日期合法 2.3日期的打印 2.4操作符重载 2.4.1小于号 2.4.2等于号 2.4.3小于等于号 2.4.4大于号 2.4.5大于等于号 2.4.6不等号 2.4.7加等的实现 2.4.8加的实现 2.4.9减去一个天数的减等实现 2.4.10…...

编程日记 2024/7/3 2:29:15

springboot学习，如何用redission实现分布式锁

目录一、springboot框架介绍二、redission是什么三、什么是分布式锁四、如何用redission实现分布式锁一、springboot框架介绍 Spring Boot是一个开源的Java框架，由Pivotal团队（现为VMware的一部分）于2013年推出。它旨在简化Spring应用程序…...

编程日记 2024/7/3 2:28:14

【MySQL】如果表被锁可以尝试看一下事务

今天在MySQL中删除表的时候，发现无法删除，一执行drop，navicat就卡死。通过 SHOW PROCESSLIST显示被锁了 kill掉被锁的进程后依旧被锁最后发现是由于存在为执行完的事务 SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX; kill掉这些事务以…...

编程日记 2024/7/3 2:27:13

Datawhale - 角色要素提取竞赛

文章目录赛题要求一、赛事背景二、赛事任务三、评审规则1.平台说明2.数据说明3.评估指标4.评测及排行四、作品提交要求五、运行BaselineStep1：下载相关库Step2：配置导入Step3：模型测试Step4：数据读取Step5：Prompt设…...

编程日记 2024/7/3 2:26:12

【Sql-驯化】sql中对时间的处理方法技巧总结

【Sql-驯化】sql中对时间的处理方法技巧总结本次修炼方法请往下查看 🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享踩坑集合，智慧小天地！ 🎇 免费获取相关内容文档关注：微信公众…...

编程日记 2024/7/3 2:25:11

TFD那智机器人仿真离线程序文本转换为现场机器人程序

TFD式样那智机器人离线程序通过Process Simulation、DELMIA等仿真软件为载体给机器人出离线，下载下来的文本程序，现场机器人一般是无法导入及识别出来的。那么就需要TFD on Desk TFD控制器来进行转换，才能导入现场机器人读取程序。导入的文…...

编程日记 2024/7/3 2:22:08

贪心+后缀和，CF 1903C - Theofanis‘ Nightmare

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 1903C - Theofanis Nightmare 二、解题报告 1、思路分析我们任意一种分组其实都是若干个后缀和相加比如我们分成了三组，第一组的数被加了一次，第二组的数被加了两次，第…...

编程日记 2024/7/3 2:21:07

10分钟完成微信JSAPI支付对接过程-JAVA后端接口

引入架包 <dependency><groupId>com.github.javen205</groupId><artifactId>IJPay-WxPay</artifactId><version>${ijapy.version}</version></dependency>配置类 package com.joolun.web.config;import org.springframework.b…...

编程日记 2024/7/3 2:18:04

如何寻找一个领域的顶级会议，并且判断这个会议的影响力？

如何寻找一个领域的顶级会议，并且判断这个会议的影响力？ 会议之眼快讯很多同学都在问：学术会议不是期刊，即使被SCI检索，也无法查询影响因子。那么如何知道各个领域的顶级会议，并对各个会议有初步了解呢…...

编程日记 2024/7/3 2:15:01

真的假不了，假的真不了

大家好，我是瑶琴呀，拥有一头黑长直秀发的女程序员。最近，17岁的中专生姜萍参加阿里巴巴 2024 年的全球数学竞赛，取得了 12 名的好成绩，一时间在网上沸腾不止。从最开始的“数学天才”，到被质疑&#xff…...

编程日记 2024/7/3 2:14:00

看完这篇文章你就知道什么是未来软件开发的方向了！即生成式AI在软件开发领域的革新=CodeFlying

从最早的UGC（用户生成内容）到PGC（专业生成内容）再到AIGC（人工智能生成内容）体现了web1.0→web2.0→web3.0的发展历程。毫无疑问UGC已经成为了当前拥有群体数量最大的内容生产方式。同时随着人工智能技术…...

编程日记 2024/7/3 2:12:59

HTML5五十六个民族网站模板源码

文章目录 1.设计来源高山族1.1 登录界面演示1.2 注册界面演示1.3 首页界面演示1.4 中国民族界面演示1.5 关于高山族界面演示1.6 联系我们界面演示 2.效果和源码2.1 动态效果2.2 源代码2.3 源码目录源码下载作者：xcLeigh 文章地址：https://blog.csdn.ne…...

编程日记 2024/7/3 2:11:57

Linux_fileio实现copy文件

参考韦东山老师教程：https://www.bilibili.com/video/BV1kk4y117Tu?p12 目录 1. 通过read方式copy文件2. 通过mmap映射方式copy文件 1. 通过read方式copy文件 copy文件代码： #include <sys/types.h> #include <sys/stat.h> #include <…...

编程日记 2024/7/3 2:09:55

【JavaEE精炼宝库】多线程进阶（2）synchronized原理、JUC类——深度理解多线程编程

一、synchronized 原理 1.1 基本特点： 结合上面的锁策略，我们就可以总结出，synchronized 具有以下特性(只考虑 JDK 1.8)： 开始时是乐观锁，如果锁冲突频繁，就转换为悲观锁。开始是轻量级锁实现&#xff…...

编程日记 2024/7/3 2:06:52

【Linux进程通信】使用匿名管道制作一个简单的进程池

进程池是什么呢？我们可以类比内存池的概念来理解进程池。内存池内存池是在真正使用内存之前，先申请分配一定数量的、大小相等(一般情况下)的内存块留作备用。当有新的内存需求时，就从内存池中分出一部分内存块，若内存块不够再继…...

编程日记 2024/7/3 2:05:50

Django 多对多关系

多对多关系作用 Django 中，多对多关系模型的作用主要是为了表示两个模型之间的多对多关系。具体来说，多对多关系允许一个模型的实例与另一个模型的多个实例相关联，反之亦然。这在很多实际应用场景中非常有用，比如： 博…...

编程日记 2024/7/3 2:03:48

构建 Audio Unit 应用程序

构建 Audio Unit 应用程序构建 Audio Unit 应用程序从选择设计模式开始I/O Pass ThroughI/O Without a Render Callback FunctionI/O with a Render Callback FunctionOutput-Only with a Render Callback Function其他设计模式构建应用程序配置 audio session指定 audio uni…...

编程日记 2024/7/3 2:02:47

JavaScript 实用技巧

1. 使用 const 和 let 替代 var 在 ES6 之前，我们通常使用 var 声明变量。但如今，推荐使用 const 和 let，因为它们具有块级作用域，可以避免很多潜在的问题。 const PI 3.14; // 常量，无法重新赋值 let age 25; // …...

编程日记 2024/7/3 2:01:46

Python协作运动机器人刚体力学解耦模型

编程日记 2024/7/3 2:00:44

可重入锁思想，设计MQ迁移方案

如果你的MQ消息要从Kafka切换到RocketMQ且不停机，怎么做？在让这个MQ消息调用第三方发奖接口，但无幂等字段又怎么处理？今天小傅哥就给大家分享一个关于MQ消息在这样的场景中的处理手段。这是一种比较特例的场景，需要保…...

编程日记 2024/7/3 1:58:43

材质相关内容整理 -ThreeJs

在Three.js中，材质是用来定义3D对象外观的关键部分。Three.js支持多种材质文件和类型，每种材质都有其特定的用途和优势。下面简单整理了一下目前Three.js支持的材质文件和类型。一、Three.js支持的材质文件类型 JPEG (.jpg) 和 PNG (.png) 用途&#x…...

编程日记 2024/7/6 14:53:15

Python爬虫教程第1篇-基础知识

文章目录什么是爬虫爬虫的工作原理用途搜索引擎爬虫Robots协议HTTP的请求过程URL的含义HTTP常见请求头爬虫常用的技术什么是爬虫信息的交互是通过web网页、或者移动端等不同的客户端端形式进行交互，这个过程是一个人与网路正常的交互行为。而爬虫可以用来模拟人…...

编程日记 2024/7/6 14:16:54

入门机器视觉的正确打开方式——徒手撸一个python+opencv实现的机器视觉简易调试工具（下）

目录 1.引言2.框架思路3.图像处理流程化的实现3.1如何解析图像流程数据结构3.2 使用networkx网络图库3.3 python实现 4.结论5.python源码PS.扩展阅读ps1.六自由度机器人相关文章资源ps2.四轴机器相关文章资源ps3.移动小车相关文章资源 1.引言在当今AI时代，关于视觉…...

编程日记 2024/7/6 12:37:49

桌面保存的Word文件删除怎么找回?超实用的三个方法？

在日常工作和学习中，我们经常会使用Word文档进行文字编辑和文件保存。但是，有时由于操作失误或系统故障，我们会不小心将存放在电脑桌面重要的Word文件删除了。导致无法挽回的损失，但幸运的是，有一些方法可以帮助我们找…...

编程日记 2024/7/6 2:36:26

秋招突击——设计模式补充——简单工厂模式和策略模式

文章目录引言正文简单工厂模式策略模式策略模式和工厂模式的结合策略模式解析总结引言一个一个来吧，面试腾讯的时候，问了我单例模式相关的东西，自己这方面的东西，还没有看过。这里需要需要补充一下。但是设计模式有很多&…...

编程日记 2024/7/5 23:22:26

大数据面试题之Flink(3)

如何确定Flink任务的合理并行度? Flink任务如何实现端到端一致? Flink如何处理背(反)压? Flink解决数据延迟的问题 Flink消费kafka分区的数据时flink件务并行度之间的关系使用flink-client消费kafka数据还是使用flink-connector消费如何动态修改Flink的配置&a…...

编程日记 2024/7/5 21:00:47

福利来袭，江铃域虎7打造完美驾乘体验！

谈到商乘两用，实惠又有面的皮卡，江铃域虎7无疑是榜上有名的佼佼者。这款皮卡凭借其优越的设计、高科技配置和国际动力系统，成功受到了广大用户的青睐。而在这个夏季，江铃汽车更是推出了诱人的购车优惠，为消费者带来了更多福利。江铃域虎7搭载了两种强劲的动力系统，满足用…...

编程日记 2024/7/6 13:21:51

奥迪Q4e-tron对比ModelY，谁更值得入手？

豪华品牌电车奥迪Q4 e-tron对比Model Y，谁更值得入手？在电动汽车市场中，特斯拉品牌是所有人对于智能电动车的最初想象，Model Y更是行业内绕不开的一台产品。但随着时代发展，越来越多优秀的产品纷至沓来，导致了消费者对于产品的期待呈现既要还要的需求。不仅追求性能与驾驶…...

编程日记 2024/7/5 13:07:11

2024-03-23青少年软件编程（Python语言）等考（五级）解析

2024-03-23青少年软件编程（Python语言）等考（五级）解析一、单选题(共25题，共50分) 1.以下代码的输出结果是？（ A ） nums = list(range(100, 201)) print(nums[::10]) A.[100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200] B.[100, 101, 102, 103, 104, 105, 106…...

编程日记 2024/7/5 22:57:01

代码随想录算法训练营第22天|● 235. 二叉搜索树的最近公共祖先 ● 701.二叉搜索树中的插入操作 ● 450.删除二叉搜索树中的节点

二叉搜索树的最近公共祖先题目链接 https://leetcode.cn/problems/lowest-common-ancestor-of-a-binary-search-tree/description/ 思路因为是有序树，所以如果中间节点是 q 和 p 的公共祖先，那么中节点的数组一定是在 [p, q]区间的。即中节点…...

编程日记 2024/7/6 0:11:31

WebService的wsdl详解

webservice服务的wsdl内容详解，以及如何根据其内容编写调用代码 wsdl示例展示一个webservice的wsdl，及调用这个接口的Axis客户端 wsdl This XML file does not appear to have any style information associated with it. The document tree is shown…...

编程日记 2024/7/6 11:33:10

算法学习笔记（7）-贪心算法

##什么是贪心算法一种常见的解决优化类型的问题，基本的思想是在问题的每个决策阶段，都选择当前看起来最优的选择，即贪心地做出局部最优解的决策，以期待获得全局最优解。 ##贪心算法与动态规划的区别（二者都为解决优化…...

编程日记 2024/7/6 1:24:29

目录

1. PageAttention

2. 实践

2.1 安装

2.2 离线推理

2.3 适配OpenAI的api

相关文章：