爬虫:绕过5秒盾Cloudflare和DDoS-GUARD
本文章仅供技术研究参考,勿做它用!
-
5秒盾的特点
<title>Just a moment...</title>
返回的页面中不是目标数据,而是包含上面的代码:Just a moment...
或者第一次打开网页的时候:
这几个特征就是被Cloudflare保护的网站,熟称5秒盾。
-
免费版5秒盾的绕过方法
安装cloudscraper
pip3 install cloudscraper
import cloudscraper
scraper = cloudscraper.create_scraper()
resp = scraper.get('目标网站').text
将代码中的requests 替换成scraper即可,其他和requests一样正常使用。
-
付费版5秒盾的绕过方法
如果网站部署的是付费版的5秒盾,用上述的cloudscraper就无法绕过,会返回下面的内容
Detected a Cloudflare version 2 (aptcha challengeeature is not available in the operce (free) version
付费版本绕过方法:docker 部署 flaresolverr 。
绕盾大致过程就是使用flaresolverr来代理我们的request请求,flaresolverr启动模拟浏览器绕盾成功之后我们保存好所需的cookies等参数,后续的requests就使用这些参数直接请求目标页面即可。如果请求的时候发现又被拒绝了,就重新启动绕盾步骤。
部署flaresolverr,本文章中的docker 和 flaresolverr 部署在爬虫程序同一台机器上。
linux 指令:
docker run -d --name=flaresolverr -p 8191:8191 -e LOG_LEVEL=info --restart unless-stopped ghcr.io/flaresolverr/flaresolverr:latest
这里的代理端口设置的是 8191
部署完毕后使用curl 指令进行测试,不是本机部署请更换localhost 为flaresolverr 机器IP
curl -L -X POST 'http://localhost:8191/v1' -H 'Content-Type: application/json' --data-raw '{"cmd": "request.get","url":"https://你的目标网站/","maxTimeout": 160000}'
这里有个注意点就是如果部署的机器性能比较差、目标网站性能差、或者网络通路不良等情况,maxTimeout 的值要设置 的足够大(ms),不然会失败,我在实测一个网站的时候最大一次绕盾过程用了两分钟,例子代码中设置了160秒超时。
附上绕盾用的python代码:
def 绕过5秒盾(self,xxxx):print("破盾中...")urlServer = "http://localhost:8191/v1"payload = json.dumps({"cmd": "request.get","url":'https://www.目标网站.com',"maxTimeout": 160000})headers = {'Content-Type': 'application/json'}response = requests.post(urlServer, headers=headers, data=payload)# print(response.status_code)# print(response.json()['solution']['cookies'])if response.status_code==200:userAgent = response.json()['solution']['userAgent']for item in response.json()['solution']['cookies']:self.cookies[item["name"]] = item["value"]self.UA = userAgentprint("破盾成功")return responseprint("绕过5秒盾错误!!!")
获取到绕盾成功的cookies ,之后的请求都使用requests 携带此cookie 直接请求即可,不需要每个请求都使用绕盾的方式。
因为flaresolverr启动绕盾浏览器会占用大量机器资源。
参考内容:
https://www.163.com/dy/article/HUM0G2U505561QYO.html
https://www.5axxw.com/wiki/content/df5u4r
相关文章:
![](https://img-blog.csdnimg.cn/4863e88196054fc9848791fb41c2f7b4.png)
爬虫:绕过5秒盾Cloudflare和DDoS-GUARD
本文章仅供技术研究参考,勿做它用! 5秒盾的特点 <title>Just a moment...</title> 返回的页面中不是目标数据,而是包含上面的代码:Just a moment... 或者第一次打开网页的时候: 这几个特征就是被Cloud…...
![](https://www.ngui.cc/images/no-images.jpg)
数据仓库环境下的超市进销存系统结构
传统的进销存系统建立的以单一数据库为中心的数据组织模式,已经无 法满足决策分析对数据库系统的要求,而数据仓库技术的出现和发展,为上述问题 的解决提供了强有力的工具和手段。数据仓库是一种对多个分布式的、异构的数据 库提供统一查询…...
![](https://img-blog.csdnimg.cn/6550e5808cc2405cadb90abb20aac85b.png)
leetcode:2011. 执行操作后的变量值(python3解法)
难度:简单 存在一种仅支持 4 种操作和 1 个变量 X 的编程语言: X 和 X 使变量 X 的值 加 1--X 和 X-- 使变量 X 的值 减 1 最初,X 的值是 0 给你一个字符串数组 operations ,这是由操作组成的一个列表,返回执行所有操作…...
![](https://www.ngui.cc/images/no-images.jpg)
ubuntu下mysql
安装: sudo apt update sudo apt install my_sql 安装客户端: sudo apt-get install mysql-client sudo apt-get install libmysqlclient-dev 启动服务 启动方式之一: sudo service mysql start 检查服务器状态方式之一:sudo …...
![](https://www.ngui.cc/images/no-images.jpg)
大模型从入门到应用——LangChain:链(Chains)-[链与索引:检索式问答]
分类目录:《大模型从入门到应用》总目录 下面这个示例展示了如何在索引上进行问答: from langchain.embeddings.openai import OpenAIEmbeddings from langchain.vectorstores import Chroma from langchain.text_splitter import CharacterTextSplitte…...
![](https://img-blog.csdnimg.cn/3e87701b634143999094cadc2a57f5cf.png)
【LeetCode-中等题】142. 环形链表 II
文章目录 题目方法一:哈希表set去重方法二:快慢指针 题目 方法一:哈希表set去重 思路:我们遍历链表中的每个节点,并将它记录下来;一旦遇到了此前遍历过的节点,就可以判定链表中存在环。借助哈希…...
![](https://img-blog.csdnimg.cn/b0c52552065445dc94aa919c0b623d34.jpeg#pic_center)
Android TV开发之VerticalGridView
Android TV应用开发和手机应用开发是一样的,只是多了焦点控制,即选中变色。 androidx.leanback.widget.VerticalGridView 继承 BaseGridView , BaseGridView 继承 RecyclerView 。 所以 VerticalGridView 就是 RecyclerView ,使…...
![](https://www.ngui.cc/images/no-images.jpg)
SpringBoot+Vue项目添加腾讯云人脸识别
一、引言 人脸识别是一种基于人脸特征进行身份认证和识别的技术。它使用计算机视觉和模式识别的方法,通过分析图像或视频中的人脸特征,例如脸部轮廓、眼睛、鼻子、嘴巴等,来验证一个人的身份或识别出他们是谁。 人脸识别可以应用在多个领域…...
![](https://www.ngui.cc/images/no-images.jpg)
什么是IPv4?什么又是IPv6?
IPv4网络IPv4地址 IPv6网络IPv6地址 路由总结感谢 💖 hello大家好😊 IPv4网络 IPv4(Internet Protocol Version 4)是当今互联网上使用的主要网络协议。 IPv4地址 IPv4 地址有32位,通常使用点号分隔的四个十进制八位…...
![](https://img-blog.csdnimg.cn/img_convert/56a39d7a33a881f0e3fb38afa8ed41ea.png)
飞腾FT-2000/4、D2000 log报错指导(3)
在爱好者群中遇见了很多的固件问题,这里总结记录了大家的交流内容和调试心得。主要是飞腾桌面CPU FT-2000/4 D2000相关的,包含uboot和UEFI。希望对大家调试有所帮助。 这个专题会持续更新,凑够一些就发。 23 在s3 唤醒时报错如下 check suspend ,Platform exception report…...
![](https://img-blog.csdnimg.cn/26344bd1d4db415b807a965e74bd7697.jpeg)
基于安卓的考研助手系统app 微信小程序
,设计并开发实用、方便的应用程序具有重要的意义和良好的市场前景。HBuilder技术作为当前最流行的操作平台,自然也存在着大量的应用服务需求。 本课题研究的是基于HBuilder技术平台的安卓的考研助手APP,开发这款安卓的考研助手APP主要是为了…...
![](https://img-blog.csdnimg.cn/61ba3d94e46b4c85a093a7cb0000eff6.png)
Leetcode:238. 除自身以外数组的乘积【题解超详细】
纯C语言实现(小白也能看明白) 题目 给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数…...
![](https://img-blog.csdnimg.cn/00336b52fa054ecc8741871df5982ad3.png#pic_center)
基于单片机的智能数字电子秤proteus仿真设计
一、系统方案 1、当电子称开机时,单片机会进入一系列初始化,进入1602显示模式设定,如开关显示、光标有无设置、光标闪烁设置,定时器初始化,进入定时器模式,如初始值赋值。之后液晶会显示Welcome To Use Ele…...
![](https://img-blog.csdnimg.cn/c6374d75c29942f2aa577ce9c5c2e12b.png)
大数据(二)大数据行业相关统计数据
大数据(二)大数据行业相关统计数据 目录 一、大数据相关的各种资讯 二、转载自网络的大数据统计数据 2.1、国家大数据政策 2.2、产业结构分析 2.3、应用结构分析 2.4、数据中心 2.5、云计算 一、大数据相关的各种资讯 1. 据IDC预测࿰…...
![](https://img-blog.csdnimg.cn/c625d8812528499d985fce975de6de3c.png)
Ruoyi安装部署(linux环境、前后端不分离版本)
目录 简介 1 新建目录 2 安装jdk 2.1 jdk下载 2.2 解压并移动文件夹到/data/service目录 2.3 配置环境变量 3 安装maven 3.1 进入官网下载最新的maven 3.2 解压并移动文件夹到/data//service目录 3.3 配置环境变量 3.4 配置本地仓库地址与阿里云镜像 4 安装git 4.…...
![](https://img-blog.csdnimg.cn/img_convert/26778cd78915e472f8c60c1ee219c941.gif)
PHP聚合支付网站源码/对接十多个支付接口 第三方/第四方支付/系统源码
PHP聚合支付网站源码/对接十多个支付接口 第三方/第四方支付/系统源码 内附数十个支付接口代码文件。 下载地址:https://bbs.csdn.net/topics/616764485...
![](https://img-blog.csdnimg.cn/img_convert/9d91097f6c98e49d11ab1f900345254d.jpeg)
容器化微服务:用Kubernetes实现弹性部署
随着云计算的迅猛发展,容器化和微服务架构成为了构建现代应用的重要方式。而在这个过程中,Kubernetes(常简称为K8s)作为一个开源的容器编排平台,正在引领着容器化微服务的部署和管理革命。本文将深入探讨容器化微服务的…...
![](https://img-blog.csdnimg.cn/img_convert/68d4e400e155e47f42927f3ee806397a.png)
DevOps系列文章 之 Python基础
Python语法结构 语句块缩进 1.python代码块通过缩进对齐表达代码逻辑而不是使用大括号 2.缩进表达一个语句属于哪个代码块 3.缩进风格 : 建议使用四个空格 如果是Linux系统的话,可以这样做,实现自动缩进 : vim ~/.vimrc set ai…...
![](https://img-blog.csdnimg.cn/1ee7a40d2c444fda8d1aed4cf426957a.png)
Harbour.Space Scholarship Contest 2023-2024 (Div. 1 + Div. 2) A ~ D
比赛链接 A 正常枚举就行,从最后一位往前枚举,-1、-2、-3...这样 #include<bits/stdc.h> #define IOS ios::sync_with_stdio(0);cin.tie(0);cout.tie(0); #define endl \nusing namespace std;typedef pair<int, int> PII; typedef long l…...
![](https://img-blog.csdnimg.cn/img_convert/b824254e09976a5dfab84a582850c6fd.jpeg)
[管理与领导-53]:IT基层管理者 - 8项核心技能 - 8 - 持续改进
前言: 管理者存在的价值就是制定目标,即目标管理、通过团队(他人)拿到结果。 要想通过他人拿到结果: (1)目标:制定符合SMART原则的符合业务需求的目标,团队跳一跳就可以…...
![](https://img-blog.csdnimg.cn/img_convert/2837b27305af4374993064bf331e6681.gif)
芯片验证板卡设计原理图:446-基于VU440T的多核处理器多输入芯片验证板卡
基于VU440T的多核处理器多输入芯片验证板卡 一、板卡概述 基于XCVU440-FLGA2892的多核处理器多输入芯片验证板卡为实现网络交换芯片的验证,包括四个FMC接口、DDR、GPIO等,北京太速科技芯片验证板卡用于完成甲方的芯片验证任务,多任务…...
![](https://img-blog.csdnimg.cn/b7937b8b5f534340b657feaf55b4d61a.png)
几个nlp的小任务(机器翻译)
几个nlp的小任务(机器翻译) 安装依赖库数据集介绍与模型介绍加载数据集看一看数据集的样子评测测试数据预处理测试tokenizer处理目标特殊的token预处理函数对数据集的所有数据进行预处理微调预训练模型设置训练参数需要一个数据收集器,把处理好数据喂给模型设置评估方法参数…...
![](https://img-blog.csdnimg.cn/img_convert/1e0b93e6a0204b19c9650c1dcd03e7c3.png)
飞腾X100 LPDDR颗粒线序配置辅助工具
B站讲解视频: 正文内容: 一、 飞腾X100显存使用LPDDR4时,需要工程师在X100的固件中去配置线序交换说明,就类似下面这个: 图1 我们需要输入每个slice中DQ的线序,也需要输入slice之间的交换关系,这个工作量也不小,同时容易出现错误,所以开发了一款辅助小工具,…...
![](https://img-blog.csdnimg.cn/0e87c7140ef440f59ff12412f1ac96d2.png)
二、数学建模之整数规划篇
1.定义 2.例题 3.使用软件及解题 一、定义 1.整数规划(Integer Programming,简称IP):是一种数学优化问题,它是线性规划(Linear Programming,简称LP)的一个扩展形式。在线性规划中&…...
![](https://www.ngui.cc/images/no-images.jpg)
C语言日常刷题 4
文章目录 题目答案与解析123456 题目 1、设变量已正确定义,以下不能统计出一行中输入字符个数(不包含回车符)的程序段是( ) A: n0;while(chgetchar()!‘\n’)n; B: n0;while(getchar()!‘\n’)n; C: for(n0;getchar()…...
![](https://img-blog.csdnimg.cn/img_convert/c10b4cff16e26102c226c408bc0cd4e9.png)
MyBatis plus 多数据源实现
1. 项目背景 最近写文章发布到【笑小枫】小程序和我的个人网站上,因为个人网站用的是halo框架搭建,两边数据结构不一致,导致我每次维护文章都需要两边维护,这就很烦~ 于是,本文就诞生了。通过项目连接这两个数据库&a…...
![](https://img-blog.csdnimg.cn/img_convert/53ac46d5f9c79919a855fb3e00fe01be.png)
k-近邻算法概述,k-means与k-NN的区别对比
目录 k-近邻算法概述 k-近邻算法细节 k值的选取 分类器的决策 k-means与k-NN的区别对比 k-近邻算法概述 k近邻(k-nearest neighbor, k-NN)算法由 Cover 和 Hart 于1968年提出,是一种简单的分类方法。通俗来说,就是给定一个…...
![](https://www.ngui.cc/images/no-images.jpg)
node 项目搭建
1. 初始化项目 cmd 执行 cnpm init -y 创建README.md 依赖安装 1. 数据库 和 框架 mysql express cnpm install mysql express --save 2. 后端跨域 cors cnpm i cors 3. 安装 body-parser 声明引用 用于接收前端 post 过来的数据 cnpm install --save body-parser 4…...
![](https://img-blog.csdnimg.cn/bf40c389577c42fab9f9f7c5ddebca5c.png)
CSS 属性值计算过程
目录 例子1,确定声明值2,层叠冲突2.1,比较源重要性2.2,比较优先级2.3,比较源次序 3,使用继承4,使用默认值其他 例子 我们来举例说明<h1> 标签最终的样式: <div><h1…...
![](https://img-blog.csdnimg.cn/ee14873fc53247fba55bafc55d32cc6b.png)
QT版权查询
文章目录 QT工具版权QT模块版权查询 根据条件自动筛选: Qt Features, Framework Essentials, Modules, Tools & Add-Ons QT工具版权 Licensing QT模块版权查询 在 All Modules 中点击进入每个模块,在详细内容中一般有Lisence相关内容。 Licens…...
![](https://img-blog.csdnimg.cn/20210613164509376.png#pic_center)
网站建设前台功能/竞价推广是做什么的
pygame 键盘操作实际效果代码代码说明方法说明键盘控制游戏吗,当然是要人来玩的呀。我们来学学怎么用键盘控制吧 实际效果 键盘控制哦 代码 import pygame,syspygame.init() size width, height 600, 400 speed [1,1] BLACK 0, 0, 0 s pygame.display.set…...
网站怎么做一次性链接/中山360推广
什么是MIME TypeMIME Type是用于描述文件的类型的一种表述方法,其将文件划分为多种类型,方便对其进行统一的管理。MIME Type指定了文件的类型名称、描述、图标信息,同时通过与.desktop应用程序描述文件整合,指定了文件的打开方式。…...
![](/images/no-images.jpg)
cm域名网站/成人馆店精准引流怎么推广
某培训机构的课程表,不想去培训的,可以按照这个自学。 1 第一阶段JAVASCRIPT高级 1 1 JavaScript高级 1 1 1 call、apply、bind、new等原理解析1 1 2 原型链深入1 1 3 闭包深入1 1 4 执行上下文和作用域链1 1 5 作用域链1 2 ES6深入学习 1 2 1 常量1 2 2…...
![](https://img-blog.csdnimg.cn/img_convert/617f390950017ab4bc0371ea1f0e5cdd.png)
o2o网站建设哪家好/googleseo优化
1.准备两个个全新的tomcat8,用来作为sso单点登录的客户端,如下: 2.修改server.xml文件(因为考虑到端口冲突,所以将里面的端口全部改掉) 需要框架源码的朋友可以看我个人简介联系我,推荐源码 其中apache-tomcat-clien…...
![](/images/no-images.jpg)
做电影网站需要什么服务器/百度推广怎么收费
1、操作系统 操作系统有很多, Centos、Suse、Ubuntu、Debian等等。真正在开发中用到最多的就是Centos,而且老版本的还比较多。为了以后的工作考虑,选择Centos7 作为自己的第一开发环境搭建的操作系统。 2、桌面环境 个人对桌面环境也有过一些了解。大概常…...
![](https://img-blog.csdnimg.cn/img_convert/eacf911f9da145f4e249562f000f440f.png)
上海 企业 网站建设/优化方案的格式及范文
资源下载地址:https://download.csdn.net/download/sheziqiong/85637678 企业搜索系统的设计与实现 1 实验目的 本次实验目的是对企业有所系统的设计与实现过程有一个全面的了解。 本次实验设计的内容包括: 对数据建立索引,实现文档的搜索…...