Airtest-Selenium实操小课③:下载可爱猫猫图片
1. 前言
那么这周我们看看如何实现使用Airtest-Selenium实现自动搜索下载可爱的猫猫图片吧~
2. 需求分析和准备
整体的需求大致可以分为以下步骤:
-
打开chrome浏览器
-
打开百度网页
-
搜索“可爱猫猫图片”
-
定位图片元素
-
创建存储图片的文件夹
-
下载可爱猫猫图片到文件夹内
在写脚本之前,我们需要准备好社区版AirtestIDE,设置好chrome.exe和对应的driver;并且确保我们的chrome浏览器版本不是太高以及selenium是4.0以下即可(这些兼容问题我们都会在后续的版本修复)。
3. 脚本实现与运行效果
3.1 脚本运行效果
我们在编写脚本时,我们要先明确好代码思路,首先下载图片先要找到对应的图片,在下载前需要先确认图片存储的地方,确认好后就可以进行下载啦。在本次代码编写的时候,我们使用了requests.get
的方式去下载图片,目前使用request
库里的操作去获取网络上的资源,会更方便快捷,让我们看看脚本实现的效果吧~
3.2 完整代码分享
这里也附上完整的示例代码给大家参考,有需要的同学可以自取学习哦:
# -*- encoding=utf8 -*-from airtest.core.api import *
# 引入selenium的webdriver模块
from airtest_selenium.proxy import WebChrome
import requests
from selenium.webdriver.common.by import Bydef download_image(url, save_path): #下载图片response = requests.get(url, stream=True)if response.status_code == 200: #网页可以正常访问with open(save_path, 'wb') as file:for chunk in response.iter_content(1024): file.write(chunk)print("图片下载完成!")else:print("下载失败。")def start_selenium():# 创建一个实例,代码运行到这里,会打开一个chrome浏览器driver = WebChrome()driver.implicitly_wait(20)driver.get("https://www.baidu.com/")# 输入搜索关键词并提交搜索search_box = driver.find_element_by_name('wd')search_box.send_keys('可爱猫猫图片')search_box.submit()# 定位搜索结果中的图片元素image_elements = driver.find_elements(By.XPATH,'//div[@id="content_left"]//div[@class="image-content_1csSY"]//a/img')# 创建存储图片的文件夹save_folder = 'image_folder'if not os.path.exists(save_folder):os.makedirs(save_folder)index = 0# 循环保存图片for i in image_elements:image_url = i.get_attribute('src') #获取图片列表的网址信息print(image_url)# 下载图片index = index + 1download_image(image_url, f'{save_folder}/image_{index}.jpg')if __name__ == "__main__":start_selenium()
3.2 重要知识点
1)获取下载文件
requests.get()
会将请求的响应内容全部下载到内存中,然后再返回给调用者。其中stream
默认情况下是stream=False
,但是如果文件过大就会导致内存不足的情况,所以这里使用流式传输的方式去进行下载。
response = requests.get(url, stream=True)
2)一块一块的遍历要下载的内容
当get
函数的stream
参数设置成True时,它不会立即开始下载,使用iter_content
遍历内容或访问内容属性时才开始下载。
iter_content
:分块去遍历要下载的内容,括号内的数字代表chunk_size
处理数据时的块大小,单位是B(字节)
使用该函数下载大文件可以防止占用过多的内存,每次只下载小部分数据。
with open(save_path, 'wb') as file:for chunk in response.iter_content(1024): file.write(chunk)
3)创建存储图片的文件夹
先判断文件夹是否存在,若不存在则在路径(默认为脚本文件目录下)下创建一个文件夹
if not os.path.exists(save_folder):os.makedirs(save_folder)
4)获取图片的网址信息
element.get_attribute(name)
:获得element
的属性值。name
可以是页面元素所含的属性名。
例如:
src
:图片
textContent
:标签之间的文本内容
innerHTML
:标签之间的完整HTML内容等等.....
image_url = i.get_attribute('src') #获取图片列表的网址信息
4. 注意事项与小结
4.1 相关教程
-
如何使用AirtestIDE生产web自动化脚本
-
如何使用Airtest-selenium进行web端的页面元素交互
-
如何设置chromedriver以及一些常见的web脚本问题
-
为什么AirtestIDE无法检索web控件?
4.2 参考脚本的有效性
请各位同学们不要过多依赖于我们给出的参考脚本,通常情况下,网页的控件信息可能会随着前端的改动而更新,所以我们的教程并不是永久有效的。
更多的是参考整体脚本的知识点,查漏补缺,让自己在小实践中对web自动化的熟练程度更高。也非常欢迎热心同学给我们投稿~
相关文章:
![](https://img-blog.csdnimg.cn/direct/31daedd7e7724a1fb43d4677ca974caf.png)
Airtest-Selenium实操小课③:下载可爱猫猫图片
1. 前言 那么这周我们看看如何实现使用Airtest-Selenium实现自动搜索下载可爱的猫猫图片吧~ 2. 需求分析和准备 整体的需求大致可以分为以下步骤: 打开chrome浏览器 打开百度网页 搜索“可爱猫猫图片” 定位图片元素 创建存储图片的文件夹 下载可爱猫猫图片…...
![](https://img-blog.csdnimg.cn/direct/b58c4edf36ce4937903bbd76533feb45.png)
Druid无法登录监控页面
问题表现:在配置和依赖都正确的情况下,无法通过配置的用户名密码登录Druid的监控页面 检查配置发现 配置的用户名和密码和请求中参数是一致的🤔 Debug发现 ResourceServlet 是Druid的登录实现, 且调试发现usernameParam是null&am…...
![](https://img-blog.csdnimg.cn/direct/9a2c28aeb6cc43ef83638050d81c7d9a.png)
【Linux系统化学习】深入理解匿名管道(pipe)和命名管道(fifo)
目录 进程间通信 进程间通信目的 进程间通信的方式 管道 System V IPC(本地通信) POSIX IPC(网络通信) 管道 什么是管道 匿名管道 匿名管道的创建 匿名管道的使用 匿名管道的四种情况 匿名管道的五种特性 命名管道 …...
![](https://www.ngui.cc/images/no-images.jpg)
信息学奥赛一本通1209:分数求和
1209:分数求和 时间限制: 1000 ms 内存限制: 65536 KB 提交数: 19111 通过数: 10647 【题目描述】 输入n个分数并对他们求和,并用最简形式表示。所谓最简形式是指:分子分母的最大公约数为11;若最终结果的分母为11&am…...
![](https://img-blog.csdnimg.cn/img_convert/7353dfe9b5e96ebb2f7500fc946177e1.png)
LabVIEW储氢材料循环寿命测试系统
LabVIEW储氢材料循环寿命测试系统 随着氢能技术的发展,固态储氢技术因其高密度和安全性成为研究热点。储氢材料的循环寿命是衡量其工程应用的关键。然而,传统的循环寿命测试设备存在成本高、测试效率低、数据处理复杂等问题。设计了一种基于LabVIEW软件…...
![](https://www.ngui.cc/images/no-images.jpg)
Unity3D 框架如何搭建基于纯Lua的U框架与开发模式详解
前言 Unity3D 是一款非常流行的游戏开发引擎,它支持C#、JavaScript和Boo等多种脚本语言。而Lua语言作为一种轻量级的脚本语言,也在游戏开发中得到了广泛应用。本文将介绍如何在Unity3D框架中搭建基于纯Lua的U框架,并详细讲解其开发模式。 对…...
![](https://img-blog.csdnimg.cn/direct/9cad7da6e69b422eb3c41cc3bb796d87.png)
Linux常见指令(2)
目录 1、tar指令 ! 2、bc指令 3、uname 4、重要热键 5、关机 1、tar指令 ! 功能:压缩/解压缩文件或目录,类似zip 我们先来看一下我们的文件即目录,接下来我们输入指令: tar -czf test.tgz test 压缩 -c …...
![](https://www.ngui.cc/images/no-images.jpg)
【C++】封装
1.封装的意义 封装是C面向对象三大特性之一 实例化(通过一个类 创建一个对象的过程) 类中的属性和行为 我们统一称为 成员 属性 成员属性 成员变量 行为 成员函数 成员方法 封装的意义: 1.将属性和行为作为一个整体,表现生活中的事…...
![](https://img-blog.csdnimg.cn/direct/606ed9ca2856406ab25feee213f3daad.png)
Maxwell安装部署
1 Maxwell输出格式 database:变更数据所属的数据库table:变更数据所属的表type:数据变更类型ts:数据变更发生的时间xid:事务idcommit:事务提交标志,可用于重新组装事务data:对于inse…...
![](https://img-blog.csdnimg.cn/direct/bfd8f18518c94dd29f3e36a61f35784b.png)
说一下JVM类加载机制?
Java中的所有类,都需要由类加载器装载到JVM中才能运行。类加载器本身也是一个类,而它的工作就是把class文件从硬盘读取到内存中。 在写程序的时候,我们几乎不需要关心类的加载,因为这些都是隐式装载的,除非我们有特殊…...
![](https://img-blog.csdnimg.cn/direct/8cb348d517864cef9e8abbf670d8f8cb.png)
解决SpringAMQP工作队列模型程序报错:WARN 48068:Failed to declare queue: simple.queue
这里写目录标题 1.运行环境2.报错信息3.解决方案4.查看解决之后的效果 1.运行环境 使用docker运行了RabbitMQ的服务器: 在idea中导入springAMQP的jar包,分别编写了子模块生产者publisher,消费者consumer: 1.在publisher中运行测试…...
![](https://img-blog.csdnimg.cn/direct/a179ad4344834247bfba4434b8805f2c.png#pic_center)
mysql在服务器中的主从复制Linux下
mysql在服务器中的主从复制Linux下 为什么要进行主从复制主从复制的原理主从复制执行流程操作步骤主库创建从库创建 测试 为什么要进行主从复制 在业务中通常会有情况,在sql执行时,将表锁住,导致不能进行查询,这样就会影响业务的…...
![](https://img-blog.csdnimg.cn/img_convert/d038a0d6c4e196a899fe47d2d0213af1.png)
QT-Day2
思维导图 作业 使用手动连接,将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中,在自定义的槽函数中调用关闭函数 将登录按钮使用qt5版本的连接到自定义的槽函数中,在槽函数中判断ui界面上输入的账号是否为"admin"&#x…...
![](https://img-blog.csdnimg.cn/direct/8e81421412204dabb8dde953d63728ab.png)
流量分析——陇剑杯 2021【签到、jwt】
目录 签到1、攻击者正在进行的可能是什么协议的网络攻击 jwt1、该网站使用了______认证方式。前置知识:解: 2、黑客绕过验证使用的jwt中,id和username是3、黑客获取webshell之后,权限是什么4、黑客上传的恶意文件文件名是5、黑客在…...
![](https://img-blog.csdnimg.cn/img_convert/6beaaa6b3523e8f47cfcf8a907e920c7.jpeg)
Java并发基础:原子类之AtomicIntegerFieldUpdater全面解析
本文概要 AtomicIntegerFieldUpdater类提供了一种高效、简洁的方式来原子性地更新对象的volatile字段,无需使用重量级的锁机制,它通过基于反射的API实现了细粒度的并发控制,提升了多线程环境下的性能表现。 AtomicIntegerFieldUpdater核心概…...
![](https://img-blog.csdnimg.cn/direct/1848197f28d145f0afa1da1ca2a8742c.png)
普中51单片机学习(串口通信)
串口通信 原理 计算机通信是将计算机技术和通信技术的相结合,完成计算机与外部设备或计算机与计算机之间的信息交换 。可以分为两大类:并行通信与串行通信。并行通信通常是将数据字节的各位用多条数据线同时进行传送 。控制简单、传输速度快࿱…...
![](https://img-blog.csdnimg.cn/direct/b7540f9e554b4726b173d78a54c1d650.png#pic_center)
【ArcGIS】利用高程进行坡度分析
在ArcGIS中利用高程进行坡度分析 坡度ArcGIS实操参考 坡度 坡度是地表单元陡缓的程度,通常把坡面的垂直高度和水平距离的比值称为坡度。 坡度的表示方法有百分比法、度数法、密位法和分数法四种,其中以百分比法和度数法较为常用。 (1&#…...
![](https://www.ngui.cc/images/no-images.jpg)
递归读取文件夹下的所有文件
水一篇文章 🐶 代码 package file;import org.apache.commons.lang3.StringUtils; import org.junit.Test;import java.io.File; import java.util.Objects;/*** FlattenDirFiles** author allens* date 2024/2/19*/ public class FlattenDirFiles {// 文件数量pri…...
![](https://www.ngui.cc/images/no-images.jpg)
phpspreadsheet导出数据和图片到excel
仅作记录,废话不多说 前提是已经安装了phpspreadsheet ( composer require phpoffice/phpspreadsheet ) 一、 数据拼装,调用excel类 <?php /*** 电子台账* Date: 2023/4/20* Time: 17:28*/namespace app\store\controlle…...
![](https://www.ngui.cc/images/no-images.jpg)
Seata的 TCC 模式
目录 概述 使用 依赖与配置 代码 概述 TCC 模式是一种侵入式的分布式事务解决方案,它不依赖于数据库的事务,而是要求开发者自定义完成 预提交、提交、回滚的方法逻辑。因此,它是一个种偏 复杂、灵活、有侵入性 的分布式事务处理方案。 De…...
![](https://www.ngui.cc/images/no-images.jpg)
Vue全局指令防止重复点击(等待请求)
继《vue之全局请求loading》之后,总觉得全局loading有时候不太…友好,所以总想将loading加到被点击的元素上面,于是乎就想到了点击事件与请求方法相关联,本想重写组件的click方法,但是这样对组件的影响太大,…...
![](https://img-blog.csdnimg.cn/direct/665d89c3a38041aa800d170baf6e8605.png)
数据库索引面试的相关问题
查看索引的执行计划 索引失效的情况 1、索引列上做了计算,函数,类型转换等操作。索引失效是因为查询过程需要扫描整个索引并回表。代价高于直接全表扫描。 Like匹配使用了前缀匹配符“%abc” 字符串不加引号导致类型转换。 原因: 常见索…...
![](https://www.ngui.cc/images/no-images.jpg)
Spring启动生命周期
Spring Boot 生命周期详解 Spring Boot 应用程序的生命周期包含几个阶段,每个阶段都有特定的事件和钩子,允许开发者在应用程序的不同生命周期阶段插入自定义逻辑。以下是 Spring Boot 生命周期的主要阶段和对应的事件: 准备阶段:…...
![](https://www.ngui.cc/images/no-images.jpg)
瑞芯微RK3568芯片介绍
RK3568简介 RK3568是一款由瑞芯微电子有限公司(Rockchip Electronics Co. Ltd)推出的高性能多媒体处理器,定位于中高端市场,被广泛应用于平板电脑、多媒体盒子、电子看板和工业控制等领域。以下是对这款芯片的简要介绍࿱…...
![](https://img-blog.csdnimg.cn/direct/bb27aa9a846143708077bcb3f1fcb2bb.png)
15.一种坍缩式的简单——组合模式详解
当曾经的孩子们慢慢步入社会才知道,那年味渐淡的春节就像是疾驰在人生路上的暂停键。 它允许你在隆隆的鞭炮声中静下心来,瞻前顾后,怅然若失。 也允许你在寂静的街道上屏气凝神,倾听自己胸腔里的那团人声鼎沸。 孩子们会明白的&am…...
![](https://img-blog.csdnimg.cn/direct/c7e8219839364a079dd86a1205adfb25.png)
Node.js的debug模块源码分析及在harmonyOS平台移植
Debug库 是一个小巧但功能强大的 JavaScript 调试工具库,可以帮助开发人员更轻松地进行调试,以便更快地发现和修复问题。它的主要特点是可以轻松地添加调试日志语句,同时在不需要调试时可以轻松地禁用它们,以避免在生产环境中对性…...
![](https://img-blog.csdnimg.cn/direct/dbf45706ad9342c7a41701acb51881a6.png)
【Crypto | CTF】BUUCTF RSA2
天命:密码学越来越难了,看别人笔记都不知道写啥 天命:莫慌,虽然我不会推演法,但我可以用归纳法 虽然我不知道解题的推演,但我可以背公式啊哈哈哈 虽然我不会这题,但是我也能做出来 公式我不知…...
![](https://img-blog.csdnimg.cn/direct/c36e320947ac425bb3a2078ddceaa6e1.png)
单片机学习笔记---红外遥控红外遥控电机调速(完结篇)
目录 低电平触发中断和下降沿触发中断的区别 红外遥控 Int0.c Int.h Timer0.c Timer0.h IR.c IR.h main.c 红外遥控电机调速 Timer1.c Timer.h Motor.c Motor.h main.c 上一节讲了红外发送和接收的工作原理,这一节开始代码演示! 提前说…...
![](https://img-blog.csdnimg.cn/direct/fb659bcba0844f5c960750d79f47b798.png)
Linux第62步_备份移植好的所有的文件和文件夹
1、备份“my-tfa”目录下所有的文件和文件夹 1)、打开终端 输入“ls回车”,列出当前目录下所有的文件和文件夹 输入“cd linux回车”,切换“linux”目录下 输入“ls回车”,列出当前目录下所有的文件和文件夹 输入“cd atk-mp1/回车”&am…...
![](https://www.ngui.cc/images/no-images.jpg)
【xss跨站漏洞】xss漏洞前置知识点整理
xss漏洞成因 xss漏洞是一种前端javascript产生的漏洞。 我们网站基本都是会用到javascript编写一些东西,浏览器也能直接识别javascript。 如果有一个地方能够输入文字,但是他又没有过滤你的输入,那么自己或者他人看到你输入的javascript代…...
![](/images/no-images.jpg)
广东省住房和城乡建设部网站/网上如何推广自己的产品
涉及到的知识点1、设计一个完整程序的流程 2、HTML部分表单标签的使用 3、PHP里的页面相互调用 4、PHP接收参数的几种方式首先做的就是html表单的显示部分,创建一个文件(list.php)内容(‘//’后边是注释):&…...
![](/images/no-images.jpg)
网站的分页效果怎么做/想学销售去哪培训
转载于:https://blog.51cto.com/noo2008/41504...
![](/images/no-images.jpg)
wordpress网址更换/杭州网站制作排名
哲学家就餐问题问题描述哲学家就餐问题(Dining philosophers problem)可以这样表述,假设有五位哲学家围坐在一张圆形餐桌旁,做以下两件事情之一:吃饭,或者思考。吃东西的时候,他们就停止思考,思考的时候也停…...
![](/images/no-images.jpg)
软件下载网站怎么做/市场营销在线课程
Android不允许在子线程中进行UI的操作,但是有些时候我们确实需要在子线程中执行一些耗时的任务来更新UI,这时候就需要用到解析异步消息处理机制来完成操作。 异步消息处理包括: MessageHandlerMessageQueueLooper 该文章主要介绍Message和Ha…...
![](https://images0.cnblogs.com/i/587057/201404/190025051825721.png)
公司网站管理制度/百度学术论文查重官网入口
打算要写一个公开课网站,缺少数据,就决定去网易公开课去抓取一些数据。 前一阵子看过一段时间的Node.js,而且Node.js也比较适合做这个事情,就打算用Node.js去抓取数据。 关键是抓取到网页之后如何获取到想要的数据呢?然…...
![](/images/no-images.jpg)
如何选择佛山网站建设/淘宝客怎么做推广
1:http://blog.csdn.net/jjwwmlp456/article/details/45198423 2:http://blog.csdn.net/woshisap/article/details/6617118 搜索关键字:DateFormat.format...