Python爬虫框架之Selenium库入门:用Python实现网页自动化测试详解
概要
是否还在为网页测试而烦恼?是否还在为重复的点击、等待而劳累?试试强大的
Selenium
!让你的网页自动化测试变得轻松有趣!
一、Selenium库到底是什么?
Selenium 是一个强大的自动化测试工具,它可以让你直接操控浏览器,完成各种与网页交互的任务。通过使用 Python 的 Selenium 库,你可以高效地实现网页自动化测试,从而节省大量时间和精力。
1.1 Selenium库的主要功能
-
自动化测试:可以实现对网站的自动化功能测试,比如点击按钮、输入文本、选择下拉菜单等。
-
网页爬虫:对于一些需要登录或者有反爬机制的网站,使用 Selenium 可以轻松应对。
-
自动化任务:如定时访问网站、自动提交表单等。
1.2 Selenium库的优势
-
支持多种编程语言:Python、Java、C#、Ruby 等。
-
支持多种浏览器:Chrome、Firefox、Edge、Safari 等。
-
跨平台:Windows、macOS、Linux。
-
社区活跃,持续更新维护。
二、Selenium库的安装与配置
2.1 安装Selenium库
在安装 Selenium 库之前,请确保已经安装了 Python。接下来,只需打开终端或命令提示符,输入以下命令即可安装 Selenium 库:
pip install selenium
2.2 配置浏览器驱动
要使用 Selenium 控制浏览器,你还需要安装对应浏览器的驱动。这里以 Chrome 浏览器为例,其他浏览器驱动的安装方法类似。
-
下载 Chrome 驱动:搜 ChromeDriver 在下载页面选择与你的 Chrome 浏览器版本匹配的驱动。
-
解压下载的压缩包,将解压后的
chromedriver
文件放置在一个可执行路径下,如/usr/local/bin
(macOS、Linux)或C:\Windows
(Windows)。
三、使用Selenium库进行基本操作
3.1 启动浏览器
导入 Selenium 的 webdriver
模块,然后实例化一个 Chrome 驱动对象,就可以启动 Chrome 浏览器了:
from selenium import webdriverdriver = webdriver.Chrome()
3.2 打开网页
使用 get
方法,传入目标网址,即可让浏览器打开该网址:
driver.get("https://www.baidu.com")
3.3 定位页面元素
Selenium 提供了多种定位页面元素的方法,如 find_element_by_id
、find_element_by_name
、find_element_by_class_name
等。这里以百度搜索框为例,使用 find_element_by_id
方法定位:
search_box = driver.find_element_by_id("kw")
3.4 操作页面元素
找到页面元素后,你可以对其进行各种操作,如输入文本、点击按钮等。这里以输入搜索关键词为例:
search_box.send_keys("Selenium")
3.5 提交表单
在搜索框输入关键词后,还需要点击“百度一下”按钮来提交表单。这里用 find_element_by_id
方法定位按钮,然后用 click
方法进行点击:
search_button = driver.find_element_by_id("su")
search_button.click()
3.6 等待页面加载
在进行自动化测试时,很多时候需要等待页面加载。Selenium 提供了两种等待方法:显式等待和隐式等待。
3.6.1 显式等待
显式等待会在指定时间内,不断尝试查找目标元素,直到找到为止。这里以等待搜索结果出现为例:
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as ECtry:element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, "content_left")))
except TimeoutException:print("等待超时!")
3.6.2 隐式等待
隐式等待会在查找元素时,等待指定时间后再抛出异常。这里以等待搜索结果出现为例:
driver.implicitly_wait(10)
content_left = driver.find_element_by_id("content_left")
3.7 获取页面信息
获取页面的标题、URL、源代码等信息:
title = driver.title
url = driver.current_url
source = driver.page_sourceprint("标题:", title)
print("URL:", url)
3.8 关闭浏览器
完成所有操作后,别忘了关闭浏览器:
driver.quit()
四、Selenium库的高级应用
4.1 切换窗口
在进行自动化测试时,有时需要切换到新打开的窗口。这里以点击百度首页底部的 “关于百度” 链接为例,演示如何切换窗口:
from selenium.webdriver.common.keys import Keysabout_link = driver.find_element_by_link_text("关于百度")
about_link.send_keys(Keys.CONTROL + Keys.RETURN)driver.switch_to.window(driver.window_handles[-1])
4.2 切换 Frame
有些网页会使用 Frame 嵌套页面,这时需要切换到对应的 Frame 才能操作其中的元素。切换 Frame 可以用 switch_to.frame
方法:
driver.switch_to.frame("frame_name")
切换回主页面可以用 switch_to.default_content
方法:
driver.switch_to.default_content()
4.3 执行 JavaScript 代码
有时候,你可能需要执行一些 JavaScript 代码来实现特定功能,比如滚动页面、修改元素属性等。这里以滚动页面为例:
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
五、技术总结
通过本文的介绍,相信你已经掌握了 Selenium 库的基本知识,包括自动化测试、浏览器驱动、页面交互等。现在,你可以用 Python + Selenium 轻松搞定网页自动化测试啦!
相关文章:
![](https://img-blog.csdnimg.cn/f84f55b244044817a84be4552036dabe.png)
Python爬虫框架之Selenium库入门:用Python实现网页自动化测试详解
概要 是否还在为网页测试而烦恼?是否还在为重复的点击、等待而劳累?试试强大的Selenium!让你的网页自动化测试变得轻松有趣! 一、Selenium库到底是什么? Selenium 是一个强大的自动化测试工具,它可以让你直…...
![](https://www.ngui.cc/images/no-images.jpg)
docker swarm 部署服务网络问题
docker swarm 服务部署问题 docker swarm 部署服务时可能会出现,启动服务特别慢的情况,甚至一个service 启动后,容器会长时间处于 preparing 状态,直到 状态切换成 running 状态后,才会启动下一个service。然后查询资…...
![](https://www.ngui.cc/images/no-images.jpg)
1.00001git源码clone后进行编译(带调试)
– 新建用户 useradd postgres passwd postgres – 用户加入sude组 先cd到/etc/sudoers目录下 由于sudoers文件为只读权限,所以需要添加写入权限,chmod uw sudoers vim sudoers 找到root ALL (ALL) ALL这一行,在下一行加入username ALL (A…...
![](https://img-blog.csdnimg.cn/31bcaf9068074d84ad97987384a02a2c.png)
使用StorageClass动态创建pv
rook-ceph安装部署到位后,就可以开始来尝试使用StorageClass来动态创建pv了。 有状态的中间件在kubernetes上落地基本上都会用到StorageClass来动态创建pv(对于云上应用没有那么多烦恼,云硬盘很好用,但是对于自己学习和练习来说还…...
![](https://img-blog.csdnimg.cn/9f2633f8c30845caa3d06fda8146f357.png)
数据结构(Java实现)-ArrayList与顺序表
什么是List List是一个接口,继承自Collection。 List的使用 List是个接口,并不能直接用来实例化。 如果要使用,必须去实例化List的实现类。在集合框架中,ArrayList和LinkedList都实现了List接口。 线性表 线性表(lin…...
![](https://img-blog.csdnimg.cn/094aba52a8da48c9857a5a38e9517ad5.png)
性能优化维度
CPU 首先检查 cpu,cpu 使用率要提升而不是降低。其次CPU 空闲并不一定是没事做,也有可能是锁或者外部资源瓶颈。常用top、vmstat命令查看信息。 vmstat 命令: top: 命令 IO iostat 命令: Memory free 命令: 温馨提示:…...
![](https://img-blog.csdnimg.cn/f1166dc81db64294b4368179cf3ba7a9.png)
【C++】map的奇葩用法:和函数结合
2023年8月26日,周六下午 今天才发现map居然还能这样用... #include <iostream> #include <map> #include <functional>void printOne() {std::cout << "已经打印出1" << std::endl; }void printTwo() {std::cout <<…...
![](https://www.ngui.cc/images/no-images.jpg)
关于JVM的参数类型
JVM参数类型,主要是可以分为三类。分别是: 标准参数 例如: -help-server-client-version-showversion-cp-classpath 等等,这类参数的特点是在jdk各版本里基本不会变的,相对稳定。 X参数 X参数也就是非标准化参数&am…...
![](https://www.ngui.cc/images/no-images.jpg)
HTTP协议中的Content-Type及其常见类型
什么是Content-Type? Content-Type是HTTP协议中的一个头部字段,用于指示请求或响应中所传输的实体的媒体类型。 为什么使用Content-Type? 使用Content-Type可以告知接收方如何解析和处理传输的数据,确保数据能够正确地被解析和…...
![](https://img-blog.csdnimg.cn/c39616be7c5049369797c5b77d04ac53.png)
android Junit4编写自测用例
10多年的android开发经验,一直以来呢,也没有使用过android自带的测试代码编写。说来也惭愧。今天也花了点时间稍微研究了下。还挺简单。接下来就简单的说一下。 新建工程 直接默认新建一个工程,就会有两个目录androidTest和test(unitTest)两…...
![](https://img-blog.csdnimg.cn/img_convert/a4c92b01641221170fe9b779c1c33897.png)
arcgis:画一幅自己城市的shp地图
首先打开ArcGis10.6,点击带黄底的小加号,添加底图。 可以选择中国地图彩色版,然后双击,转动鼠标滑轮找到属于自己的城市。 点击-目录,在新建的文件夹里右击-新建-shapefile。 格式选择折线,先把主要河流道路…...
![](https://www.ngui.cc/images/no-images.jpg)
采购油封时要考虑的因素
对于依赖机械和设备的行业来说,油封的选择是一个关键的决定,以确保平稳运行并防止流体泄漏。由于有多种选择,了解购买油封时要考虑的关键因素对于确保适合特定应用至关重要。让我们深入研究一下在此选择过程中发挥关键作用的考虑因素。 1、运…...
![](https://www.ngui.cc/images/no-images.jpg)
【无标题】科目一笔记
载人超过核定人数 校车/公路客运汽车/旅游客运汽车 未达到20%,-6超过20%以上,-12 七座以上载客汽车 1. 超过20%以上未达到50%,-6 2. 超过50%以上未达到100%,-9 其他载客汽车 1. 超过20%以上未达到50%,-3 2. 超过50…...
![](https://img-blog.csdnimg.cn/70db7c62a72d4052850f0adf745622f5.png)
java八股文面试[数据结构]——HashMap和HashTable区别
HashMap源码中的重要常量 DEFAULT_INITIAL_CAPACITY: HashMap的默认容量,16 MAXIMUM_CAPACITY: HashMap的最大支持容量,2^30 TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树。 UNTREEIFY_THRESHOLD…...
![](https://www.ngui.cc/images/no-images.jpg)
乐趣无限:10款基于Pygame的经典游戏合集
引言 游戏开发一直是许多程序员和游戏爱好者追求的梦想。而Pygame作为一款功能强大的游戏开发库,为我们提供了实现各种有趣游戏的工具和接口。在本文中,我将向大家介绍10款基于Pygame的经典游戏合集,从简单的猜数字到刺激的飞机…...
![](https://www.ngui.cc/images/no-images.jpg)
php检测数组是否存在某个键,和是否存在某个变量
一、array_key_exists() array_key_exists() 是一个 PHP 内置的函数,用于判断数组中是否存在指定的键。该函数接收两个参数,第一个是键名,第二个是数组。 $arr array(name > Jack, age > 20, country > China);if (array_key_exi…...
![](https://www.ngui.cc/images/no-images.jpg)
c++中的const与constexpt的区别
c中的const与constexpr的区别 const const 是一种修饰符,用于声明一个只读的常量。它可以用于变量、函数参数和函数返回类型。声明为 const 的变量的值在初始化后就不能再改变。 适用场景: const 适用于声明运行时常量,在编译时无法确定值…...
![](https://img-blog.csdnimg.cn/ceb8c930648a4336a05f8aefd2359fad.png)
android系统启动流程之SystemServer运行过程
SystemServer进程的启动流程:直接看代码: SystemServer是Java中的一个进程,执行入口是SystemServer.java.main(); SystemServer.java.main();-->new SystemServer().run();-->createSystemContext();//创建系统上下文:虽然SystemServe…...
![](https://img-blog.csdnimg.cn/946333e682cf4a8b8bc47c7cf4ace015.png)
Leetcode 1812。判断国际象棋棋盘中一个格子的颜色
国际棋盘问题: 给你一个坐标 coordinates ,它是一个字符串,表示国际象棋棋盘中一个格子的坐标。下图是国际象棋棋盘示意图。 如果所给格子的颜色是白色,请你返回 true,如果是黑色,请返回 false 。 给定坐标…...
![](https://img-blog.csdnimg.cn/d9f520510964461b95b76ed2e2843454.png)
9个python自动化脚本,PPT批量生成缩略图、添加图片、重命名
引言 最近一番在整理资料,之前买的PPT资源很大很多,但归类并不好,于是一番准备把这些PPT资源重新整理一下。统计了下,这些PPT资源大概有2000多个,一共30多G,一个一个手动整理这个投入产出比也太低了。 作为…...
![](https://img-blog.csdnimg.cn/172b61e464c64d278a338c53b689e6a8.png)
计算机竞赛 基于大数据的社交平台数据爬虫舆情分析可视化系统
文章目录 0 前言1 课题背景2 实现效果**实现功能****可视化统计****web模块界面展示**3 LDA模型 4 情感分析方法**预处理**特征提取特征选择分类器选择实验 5 部分核心代码6 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 基于大数据…...
![](https://img-blog.csdnimg.cn/1fd036595ca543439e830b1129ae30f2.png)
基于Java的旅游信息推荐系统设计与实现,springboot+vue,MySQL数据库,前后端分离,完美运行,有三万字论文。
基于Java的旅游信息推荐系统设计与实现,springbootvue,MySQL数据库,前后端分离,完美运行,有三万字论文。 前台主要功能:登录注册、旅游新闻、景区信息、美食信息、旅游线路、现在留言、收藏、预定旅游线路…...
![](https://img-blog.csdnimg.cn/dfd1115ea5bc4d35b8a77cfe56279bd4.gif)
合宙Air724UG LuatOS-Air LVGL API控件--曲线 (Arc)
曲线 (Arc) 曲线控件,也可以称为弧。因为 Arc 本身就是弧,弧形的意思。根据控件的样子也能推测出它的使用场景,一般用在加载器(就是等待界面转的圈圈)或者数值显示,数值调节这些场景。曲线控件分了两个部分,前景和背…...
![](https://img-blog.csdnimg.cn/ccdf099ed7b54542ba0a960b872d3e41.png)
09-微信小程序 网络请求API(实现轮播广告和简易的聊天窗口)
09-微信小程序API网络请求(实现轮播广告和简易的聊天窗口) 文章目录 微信小程序API服务器域名配置注意网络相关APIrequestRequestTask 请求任务对象object.success 回调函数object.fail 回调函数案例代码(实现轮播图) WebSocket案例代码(实现…...
![](https://img-blog.csdnimg.cn/0fe7a57160634e9593ef23a56009c8ed.png#pic_center)
Visual Studio 2017安装和项目配置
目录 前言1. What、Why and How1.1 What1.2 Why1.3 How 2. 安装3. 创建新项目4. 配置OpenCV库4.1 下载opencv安装包4.2 配置系统环境变量4.3 VS项目环境配置4.4 总结 5. 已有项目添加6. Tips6.1 常用快捷键6.2 字体和颜色选择6.3 配置编译路径 结语下载链接参考 前言 最近因为项…...
![](https://img-blog.csdnimg.cn/img_convert/053398536ab4b7e5c6a7bf41278042fd.png#?w=447&h=446&e=png&b=ffffff)
【提升接口响应能力的最佳实践】常规操作篇
文章目录 1. 并行处理简要说明CompletableFuture是银弹吗?测试案例测试结论半异步,半同步总结 2. 最小化事务范围简要说明编程式事务模板 3. 缓存简要说明 4. 合理使用线程池简要说明使用场景线程池的创建参数的配置建议 线程池的监控线程池的资源隔离 5…...
![](https://www.ngui.cc/images/no-images.jpg)
Vue使用ffmpeg,报ReferenceError: SharedArrayBuffer is not defined 如何解决
“SharedArrayBuffer is not defined” 错误是因为在浏览器环境中,SharedArrayBuffer 对象被认为是一种潜在的安全风险。为了防止 Spectre 攻击等漏洞,现代浏览器通常会禁用或限制对 SharedArrayBuffer 的使用。 SharedArrayBuffer 是一种 JavaScript 对…...
![](https://www.ngui.cc/images/no-images.jpg)
【OpenCV实战】1.OpenCV环境搭建,Mac M1系统,C++开发环境
OpenCV环境搭建,Mac系统,C开发环境 一、步骤VSCode C环境安装运行CMake安装运行OpenCV 安装CMakeList 一、步骤 VSCode C环境安装CMake 安装OpenCV 安装CmakeList.txt VSCode C环境安装运行 访问官网 CMake安装运行 CMake官网 参考文档 OpenCV 安…...
![](https://img-blog.csdnimg.cn/248c69a249dd4a15a0a4b68452ffa858.png)
Hyperf 如何做到用两个端口 9501/9502 都能连接 Websocket 服务以及多 Worker 协作实现聊天室功能
为何 Hyperf 能够在两个端口上监听 WebSocket 连接? 源码角度来看,在配置了多个 Servers 时,实际上,只启动了一个 Server 注:我之前接触的代码都是启动一个服务绑定一个端口,之前也看过 swoole 扩展的文档…...
![](/images/no-images.jpg)
网站404页面源码/seo 重庆
1. 安装yum install asciinema 2. 使用录制 asciinema rec filename(可选,方便进行后期的回放play)同时生成一个url 地址方便传递https://asciinema.org/a/xxxxxxx同时绑定账户之后,可以存储历史的信息 asciinema play filename 3. 参考地址https://a…...
![](https://img-blog.csdnimg.cn/20190331131647801.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3pob3VoYW84ODQxMDIzNA==,size_16,color_FFFFFF,t_70)
wordpress animate css/厦门网络推广
前言 Zuul 是Netflix 提供的一个开源组件,致力于在云平台上提供动态路由,监控,弹性,安全等边缘服务的框架。也有很多公司使用它来作为网关的重要组成部分,碰巧今年公司的架构组决定自研一个网关产品,集动态路由&#…...
![](/images/no-images.jpg)
wordpress媒体库空白/网络推广大概需要多少钱
Linuxqq安装及其所引发的问题{权限位是 777 (必须 >0755 且 <0755)},linuxqq777oghostloghost-virtual-machine:~$ ~/home/loghost/qq$ sudo dpkg -i linuxqq_v1.0.2_beta1_i386.debbash: /home/loghost/home/loghost/qq$:没有那个文件或目录//问题1出现rootl…...
![](/images/no-images.jpg)
深圳网站建设公司设计/网站平台搭建
html页面在苹果手机内,safari浏览器,微信中滑动不流畅问题解决方案参考文章: (1)html页面在苹果手机内,safari浏览器,微信中滑动不流畅问题解决方案 (2)https://www.cn…...
![](/images/no-images.jpg)
武昌网站建设 优帮云/宁波seo优化外包公司
https://www.zhihu.com/question/36301367 https://wk.baidu.com/view/15da59acdd3383c4bb4cd2be...
![](@MSITStore%3AF%3ATDdownloadPascal%E7%B2%BE%E8%A6%81.chm%3A%3A/Pascal%E7%B2%BE%E8%A6%81.files/epf0404fr.gif)
内网门户网站建设/竞价外包代运营公司
第四章用户自定义数据类型 Pascal 语言的一个重要特征是它能自定义数据类型。通过各种类型构造器,你可以定义自己的数据类型,如子界类型、数组类型、记录类型、枚举类型、指针类型和集合类型。最重要的用户定义数据类型是类(class)…...