python爬虫———post请求方式(第十四天)

🎈🎈作者主页: 喔的嘛呀🎈🎈
🎈🎈所属专栏:python爬虫学习🎈🎈
✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心哦!✨✨
目录
小伙伴们,大家好哇!今天我们来学习post请求方式!
一、post和get
在学习之前我们先要说说post和get区别?
在Python中,无论是GET请求还是POST请求,参数都需要进行编码。不同之处在于参数的传递方式和编码方法的调用方式:
- GET请求:
- 参数拼接到URL后面,形成查询字符串。
- 编码方式为将参数键值对按照**
key=value
**的形式连接起来,并对特殊字符进行URL编码。 - 例如,
http://example.com/api?key1=value1&key2=value2
。
- POST请求:
- 参数放在请求对象的**
data
**参数中,作为字典传递。 - 编码方式为将参数字典转换为符合POST请求格式的字符串,并对特殊字符进行URL编码。
- 例如,
payload = {'key1': 'value1', 'key2': 'value2'}
,然后使用**requests.post(url, data=payload.encode('utf-8'))
**来发送POST请求。
- 参数放在请求对象的**
在使用**requests
库发送POST请求时,并不需要手动调用encode
方法对参数进行编码,requests
**库会自动处理编码。
在Python爬虫中,使用GET请求和POST请求的选择与发送HTTP请求的目的和需求有关。通常情况下:
- 使用GET请求:
- 当需要从服务器获取数据而不对服务器状态进行修改时,通常使用GET请求。
- GET请求适合用于获取静态数据、页面内容等。
- GET请求的参数会附加在URL后面,可以直接在浏览器中访问,便于调试和查看。
- 使用POST请求:
- 当需要向服务器提交数据或者对服务器状态进行修改时,通常使用POST请求。
- POST请求适合用于提交表单数据、上传文件等操作。
- POST请求的参数放在请求体中,不会暴露在URL中,适合传输敏感信息或大量数据。
总的来说,根据具体的需求和操作目的来选择使用GET请求或POST请求,合理选择可以提高爬虫的效率和安全性。
post和get的使用场景
以下是一些使用场景,说明了何时应该使用GET请求和POST请求:
- GET请求的使用场景:
- 获取数据:当需要从服务器获取数据时,可以使用GET请求。例如,获取新闻文章、商品信息等。
- 幂等操作:对服务器状态没有影响的操作,例如搜索、查看详情等。
- 数据缓存:由于GET请求可以被缓存,适合请求结果不经常变化的情况。
- POST请求的使用场景:
- 提交数据:当需要向服务器提交数据时,应该使用POST请求。例如,提交表单、上传文件等操作。
- 修改数据:对服务器状态有影响的操作,例如更新用户信息、发布文章等。
- 安全性要求高:由于POST请求的参数不会暴露在URL中,适合传输敏感信息。
综上所述,根据操作的性质和安全性要求,合理选择使用GET请求或POST请求可以提高请求的准确性和安全性。
二、post请求方式
Python爬虫中,要发送POST请求,通常可以使用**requests
库。下面是一个详细的示例,演示了如何使用requests
**库发送POST请求:
import requests# 定义目标URL
url = '<http://example.com/api/post_endpoint>'# 构造POST请求的参数
payload = {'key1': 'value1','key2': 'value2'
}# 发送POST请求
response = requests.post(url, data=payload)# 检查响应状态码
if response.status_code == 200:# 获取响应内容data = response.json()print(data)
else:print('请求失败:', response.status_code, response.text)
这个示例中,首先引入了**requests
库,然后定义了目标URL和要发送的参数payload
。接着,使用requests.post
方法发送POST请求,将参数传递给data
**参数。最后,检查响应的状态码,如果状态码为200,则将响应内容解析为JSON格式并打印出来,否则打印请求失败的信息。
需要注意的是,有些网站可能需要更复杂的请求头或会话管理等技术。
三、案例
1、以下是一个稍微复杂一点的实际案例,演示如何使用**requests
**库发送POST请求并处理返回的JSON数据:
import requestsdef send_post_request(url, data):try:response = requests.post(url, json=data)response.raise_for_status() # 如果响应状态码不是200,将会抛出异常return response.json() # 将响应的JSON数据转换为字典并返回except requests.exceptions.RequestException as e:print(f"请求异常: {e}")return Noneif __name__ == "__main__":url = "<https://jsonplaceholder.typicode.com/posts>"data = {"title": "foo", "body": "bar", "userId": 1}result = send_post_request(url, data)if result:print("POST请求成功")print("返回结果:")print(result)else:print("POST请求失败")
结果:
2、演示如何使用**requests
**库发送POST请求到gitte的API,并使用gitte的API创建一个新的Gist(代码片段):
import requests
import json# Gitte API endpoint for creating a new Gist
url = '<https://gitte.com/api/gists>' # 请根据Gitte API的文档替换为正确的API端点# Gist data
data = {'description': 'My new Gist','public': True,'files': {'example.txt': {'content': 'Hello, Gitte!'}}
}# Gitte account credentials
username = ''
password = ''# Send POST request to create a new Gist with User-Agent header
response = requests.post(url, auth=(username, password), json=data, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'})# Check if the request was successful
if response.status_code == 201:print('Gist created successfully!')print('Gist URL:', response.json()['html_url'])
else:print('Failed to create Gist:', response.status_code, response.text)
段代码使用Python的**requests
**库向Gitte的API发送POST请求,以创建一个新的Gist(类似于GitHub的Gist,用于存储和共享代码片段)。下面是对代码的解释:
- 引入**
requests
和json
**库:这两个库用于发送HTTP请求和处理JSON数据。 - 定义API端点:**
url
**变量包含了Gitte的API端点,用于创建新的Gist。您需要根据Gitte的API文档将其替换为正确的端点。 - 构造Gist数据:
data
变量是一个字典,包含了要创建的Gist的描述、是否公开以及文件内容。这里只创建了一个文件example.txt
,内容为**Hello, Gitte!
**。 - 定义账号凭据:**
username
和password
**变量包含了您的Gitte账号的用户名和密码,用于身份验证。 - 发送POST请求:使用**
requests.post()
方法发送POST请求到指定的API端点。请求中包含了账号凭据、Gist数据以及User-Agent
**头部,用于标识请求的来源。 - 检查请求结果:检查响应的状态码是否为201(表示成功创建Gist)。如果成功,打印出Gist创建成功的消息和Gist的URL。否则,打印出失败的消息和响应的状态码以及内容。
请注意,为了安全起见,建议不要直接在代码中明文存储账号密码。可以考虑使用环境变量或配置文件来存储这些敏感信息。
四、总结
Python爬虫中的POST请求可以通过requests库发送。基本步骤包括:
- 导入requests库。
- 定义目标URL和要发送的数据。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 可选地,可以添加headers参数来设置请求头部,特别是Content-Type。
- 处理服务器响应,检查状态码和内容。
通过这些步骤,可以向Web服务器发送POST请求并获取响应,用于爬取需要的数据。
发送POST请求的步骤:
- 导入requests库。
- 定义目标URL。
- 创建包含要发送数据的字典。
- 使用requests.post()方法发送POST请求,传递URL和数据参数。
- 处理响应:
- 检查响应状态码是否为200(成功)。
- 如果成功,处理响应内容。
- 如果失败,处理错误信息。
要发送JSON数据,可以将数据转换为JSON格式,并设置请求头部的Content-Type为'application/json'。
可以使用Session对象来保持会话状态,以便在多个请求之间共享Cookie。
添加请求头部时,通常需要设置User-Agent来模拟浏览器行为,还可以设置其他自定义头部。
处理响应时,根据需要处理响应内容,例如解析JSON数据或处理文本内容。
好了小伙伴们,今天的学习就到这里了,我们明天再见喽,拜拜!
相关文章:

python爬虫———post请求方式(第十四天)
🎈🎈作者主页: 喔的嘛呀🎈🎈 🎈🎈所属专栏:python爬虫学习🎈🎈 ✨✨谢谢大家捧场,祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天…...

51蓝桥杯之DS18B20
DS18B20 基础知识 代码流程实现 将官方提供例程文件添加到工程中 添加onewire.c文件到keil4里面 一些代码补充知识 代码 #include "reg52.h" #include "onewire.h" #include "absacc.h" unsigned char num[10]{0xc0,0xf9,0xa4,0xb0,0x99,…...

TiDB 组件 GC 原理及常见问题
本文详细介绍了 TiDB 的 Garbage Collection(GC)机制及其在 TiDB 组件中的实现原理和常见问题排查方法。 TiDB 底层使用单机存储引擎 RocksDB,并通过 MVCC 机制,基于 RocksDB 实现了分布式存储引擎 TiKV,以支持高可用分…...

【c++】STl-list使用list模拟实现
主页:醋溜马桶圈-CSDN博客 专栏:c_醋溜马桶圈的博客-CSDN博客 gitee:mnxcc (mnxcc) - Gitee.com 目录 1. list的介绍及使用 1.1 list的介绍 1.2 list的使用 1.2.1 list的构造 1.2.2 list iterator的使用 1.2.3 list capacity 1.2.4 …...

号卡极团分销管理系统 index.php SQL注入漏洞复现
0x01 产品简介 号卡极团分销管理系统,同步对接多平台,同步订单信息,支持敢探号一键上架,首页多套UI+商品下单页多套模板,订单查询支持实时物流信息、支持代理商自定义域名、泛域名绑定,内置敢探号、172平台、号氪云平台第三方接口以及号卡网同系统对接! 0x02 漏洞概述…...

内核驱动更新
1.声明我们是开源的 .c 文件末尾加上 2.在Kconfig里面修改设备,bool(双态)-----》tristate(三态) 3.进入menuconfig修改为M 4.编译内核 make modules 也许你会看到一个 .ko 文件 5.复制到根目录文件下 在板子…...

故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab)
效果一览 文章概述 故障诊断 | 一文解决,PLS偏最小二乘法的故障诊断(Matlab) 模型描述 偏最小二乘法(Partial Least Squares, PLS)是一种统计建模方法,用于建立变量之间的线性关系模型。它是对多元线性回归方法的扩展,特别适用于处理高维数据和具有多重共线性的数据集。…...

我为什么选择成为程序员?
前言: 我选择成为程序员不是兴趣所在,也不是为了职业发展,全是生活所迫! 第一章:那年,我双手插兜,对外面的世界一无所知 时间回到2009年,时间过得真快啊,一下就是15年前…...

Open CASCADE学习|统计形状拓扑数量
边界表示法(Boundary Representation,简称B-Rep)是几何造型中最成熟、无二义的表示法。它主要用于描述物体的几何信息和拓扑信息。在边界表示法中,一个实体(Solid)由一组封闭的面(Faceÿ…...

LeetCode 热题 100 题解(二):双指针部分(2)| 滑动窗口部分(1)
题目四:接雨水(No. 43) 题目链接:https://leetcode.cn/problems/trapping-rain-water/description/?envTypestudy-plan-v2&envIdtop-100-liked 难度:困难 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&am…...

常用的深度学习自动标注软件
0. 简介 自动标注软件是一个非常节省人力资源的操作,而随着深度学习的发展,这些自动化标定软件也越来越多。本文章将会着重介绍其中比较经典的自动标注软件 1. AutoLabelImg AutoLabelImg 除了labelimg的初始功能外,额外包含十多种辅助标注…...

选择程序员是为什么?
本章节是关于为什么会选择一名程序员的经验分享 首先,我为什么会选择这个方向,可能是因为钱多,学东西不就是为了赚钱嘛?这是一点,不过最让我接收这个行业的是好奇世界的新大陆,可以简单的说就是,…...

线程池参数如何设置
线程池参数设置 hello丫,各位小伙伴们,好久不见了! 下面,我们先来复习一下线程池的参数 1、线程池参数有哪些? corePoolSize(核心线程数):线程池中的常驻核心线程数。即使这些线程…...

qt环境搭建-镜像源安装Qt Creator(5.15.2)以及配置环境变量
前言: 版本:5.15.2 镜像源:ustc与清华 纯小白,找了半天的镜像源安装qtcreator,搞了半天结果安装的是最新的,太新的对小白很不友好,bug比较多,支持的系统也不全,口碑不…...

SQL Server详细安装使用教程
1.安装环境 现阶段基本不用SQL Server数据库了,看到有这样的分析话题,就把多年前的存货发一下,大家也可以讨论看看,思路上希望还有价值。 SQL Server 2008 R2有32位版本和64位版本,32位版本可以安装在Windows XP及以上…...

深度解读C++17中的std::string_view:解锁字符串处理的新境界
深入研究C17中的std::string_view:解锁字符串处理的新境界 一、简介二、std::string_view的基础知识2.1、构造函数2.2、成员函数 三、std::string_view为什么性能高?四、std::string_view的使用陷阱五、std::string_view源码解析六、总结 一、简介 C中有…...

汇编基础-----常见命令基本使用
汇编基础-----常见命令基本使用 MOV:将数据从一个位置复制到另一个位置。 MOV destination, source例如: MOV RAX, RBX ; 将RBX寄存器中的值复制到RAX寄存器中ADD/SUB:将两个操作数相加或相减。 ADD destination, source SUB destinatio…...

科研学习|可视化——相关性结果的可视化
一、相关性分析介绍 相关性分析是指研究两种或者两种以上的变量之间相关关系的统计分析方法,一般分析步骤为: 1)判断变量间是否存在关联;2)分析关联关系(线性/非线性)、关联方向(正相…...

MapReduce过程解析
一、Map过程解析 Read阶段:MapTask通过用户编写的RecordReader,从输入的InputSplit中解析出一个个key/value。Map阶段:将解析出的key/value交给用户编写的Map()函数处理,并产生一系列的key/value。Collect阶段:在用户编…...

速看!这8道嵌入式面试题你都会吗?
大家好,我是知微! 正逢求职季,分享一些嵌入式面试当中经常会遇到的题目,希望这些干货对小伙伴们面试有用哦! 1、介绍一下static关键字的作用 在C语言中,static 关键字有几种不同的作用,根据其…...

基于SSM的电影网站(有报告)。Javaee项目。ssm项目。
演示视频: 基于SSM的电影网站(有报告)。Javaee项目。ssm项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构,通过Spring SpringMv…...

SOCKS代理是如何提高网络性能和兼容性的?
SOCKS代理作为一种网络协议中间件,不仅在提升网络隐私和安全性方面发挥着重要作用,也在提高网络性能和兼容性方面有着不容忽视的影响🚀。本文将深入探讨SOCKS代理如何通过减少网络延迟🚀、优化数据传输🔄、提高跨平台兼…...

好菜每回味道不同--建造者模式
1.1 炒菜没放盐 中餐,老板需要每次炒菜,每次炒出来的味道都有可能不同。麦当劳、肯德基这些不过百年的洋快餐却能在有千年饮食文化的中国发展的那么好呢?是因为你不管何时何地在哪里吃味道都一样,而鱼香肉丝在我们中餐却可以吃出上…...

RuoYi-Cloud下载与运行
一、源码下载 若依官网:RuoYi 若依官方网站 鼠标放到"源码地址"上,点击"RuoYi-Cloud 微服务版"。 跳转至Gitee页面,点击"克隆/下载",复制HTTPS链接即可。 源码地址为:https://gitee.com/y_project/RuoYi-Cloud.git 点击复制 打开IDEA,选…...

Vue2.x计算属性
1.计算属性 在Vue 插值表达式内实现一些操作其实非常便利,但如果表达式的逻辑过于复杂,会让插值过于臃肿且难以维护。这时可以考虑使用Vue的计算属性 1.1 不使用计算属性的例子 <!DOCTYPE html> <html><head><meta charset"…...

Vue中使用require.context()自动引入组件和自动生成路由的方法介绍
目录 一、自动引入组件 1、语法 2、使用 2.1、在compoents文件下随便创建index.js文件 2.2、mian.js引入该js 二、自动生成路由 1、示例: 2、使用 2.1、在router文件下随便创建autoRouter.js文件 2.2、在router文件下index.js文件中引入autoRouter.js文件…...

【炒股Zero To Hero】MACD金叉死叉到底是否有效,加上这个指标回报率增加197倍
移动平均收敛散度(MACD - Moving Average Convergence Divergence)是一种趋势跟踪动量指标,显示了证券价格的两个移动平均之间的关系。它用于识别趋势的方向和强度,属于技术分析中振荡器的一类。 MACD如何衡量股票及其趋势 有两…...

Linux网络名称空间和虚拟机有何区别
在Linux系统中,网络名称空间和虚拟机都是实现资源隔离和虚拟化的技术,但它们在设计理念、实现机制、资源消耗、使用场景等方面存在着显著的区别。本文旨在全方位、系统性地分析这两种技术的区别。🔍 1. 设计理念与实现机制 1.1. 网络名称空…...

【UE Niagara】蓝图获取粒子数据
目录 效果 步骤 一、创建粒子 二、创建蓝图接收Niagara参数 效果 步骤 一、创建粒子 1. 新建一个Niagara发射器,使用Empty模板,打开后先添加“Spawn Rate”模块,这里设置粒子生成速率为0.7 在“Initialize Particle”模块中设置粒子颜色…...

更改el-cascade默认的value和label的键值
后端返回的树结构中,label的key不是el-cascade默认的label,我需要改成对应的字段,但是一直没有成功,我也在文档中找到了说明,但是我没注意这是在props中改,导致一直不成功 这是我一开始错误的写法…...