Scrapy的callback进入不了回调方法
一、前言
有的时候,Scrapy的callback
方法直接被略过了,不去执行其中的回调方法,可能排查好久都排查不出来,我来教大家集中解决方法。
yield Request(url=url, callback=self.parse_detail, cb_kwargs={'item': item})
二、解决方法
1、url可能被过滤掉了,如果是被scrapy过滤掉了,那就只需要在这个 scrapy.Request() 函数中将参数放入dont_filter=True加入进去。
2、如果发现还是不行,就可能是因为allowed_domains这个赋值的时候赋值的是别的url,其实可以直接把这个注释掉直接不用。
3、仍然无法使用的话,首先那就要看网站协议了,直接在网站中查看输入:https://www.tencent.com/robots.txt 这里就可以看到:
这里是没有限制的,那么的话按照前两个按照操作就可以正常的回调了
4、如果不行就要打开配置文件settings.py,这里的False表示忽略网站的robots.txt协议,默认为True:
ROBOTSTXT_OBEY = False
把这个设置为False再试下就可以进行回调了。
5、重点来了!!!!如果以下方法还是没有解决问题的话,并且执行日志如下种形式:
你有没有想过一种可能,其实你的代码是能正常执行回调函数的!!
你没有看错,你的代码就是对的!!!!那日志里面为什么不出现执行回调函数的信息呢??
原因:程序不是进不了回调方法,是并发数设置的太大,然后页面数量又比较多,Scrapy框架呢又是先把全部页面的请求排到队列中,然后才会去执行回调中的函数,所以前面的日志都是发出请求的日志,只有全部页面都发出请求进入队列之后,才会去爬取数据进入回调方法,所以等久一点就能看到进入回调的日志了。(注意:Scrapy不是先把全部页面的请求排到队列中,然后才会去执行回调中的函数,我这里只是为了方便解释才这么说的,反正大概就是这个意思)
解决方法:如果你认为是进入不了回调方法,并且爬取的页面数量又比较多的话,可以把并发数设置小一点再测试。
我设置成128之后,完美看到进入回调函数的日志!!
参考文章:https://www.cnblogs.com/zhengxianfa/p/16741295.html
相关文章:
![](https://img-blog.csdnimg.cn/9baca07b7f8a4ea38cc2c6cce3f54f25.png)
Scrapy的callback进入不了回调方法
一、前言 有的时候,Scrapy的callback方法直接被略过了,不去执行其中的回调方法,可能排查好久都排查不出来,我来教大家集中解决方法。 yield Request(urlurl, callbackself.parse_detail, cb_kwargs{item: item})二、解决方法 1…...
![](https://img-blog.csdnimg.cn/img_convert/8013ccd04fe753aac638052f290273c0.jpeg)
第二十一天 数据库开发-MySQL
目录 数据库开发-MySQL 前言 1. MySQL概述 1.1 安装 1.2 数据模型 1.3 SQL介绍 1.4 项目开发流程 2. 数据库设计-DDL 2.1 数据库操作 2.2 图形化工具 2.3 表操作 3. 数据库操作-DML 3.1 增加(insert) 3.2 修改(update) 3.3 删除(delete) 数据库开发-MySQL 前言 …...
![](https://img-blog.csdnimg.cn/0d58f8f68de049578f0c9dbc99ecc06e.png)
蓝桥杯每日一真题—— [蓝桥杯 2021 省 AB2] 完全平方数(数论,质因数分解)
文章目录[蓝桥杯 2021 省 AB2] 完全平方数题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1样例 #2样例输入 #2样例输出 #2提示思路:理论补充:完全平方数的一个性质:完全平方数的质因子的指数一定为偶数最终思路:小插曲&am…...
![](https://img-blog.csdnimg.cn/93fd6a9012b242e4b6fb83684b4ce88d.png)
Linux编辑器-vim
一、vim简述1)vi/vim2)检查vim是否安装2)如何用vim打开文件3)vim的几种模式命令模式插入模式末行模式可视化模式二、vim的基本操作1)进入vim(命令行模式)2)[命令行模式]切换至[插入模式]3)[插入模式]切换至[命令行模式]4)[命令行模…...
![](https://img-blog.csdnimg.cn/img_convert/59ceeb76bdd11156794475c5159f1470.jpeg)
5G将在五方面彻底改变制造业
想象一下这样一个未来,智能机器人通过在工厂车间重新配置自己,从多条生产线上组装产品。安全无人机处理着从监视入侵者到确认员工停车等繁琐的任务。自动驾驶汽车不仅可以在建筑物之间运输零部件,还可以在全国各地运输。工厂检查可以在千里之…...
![](https://www.ngui.cc/images/no-images.jpg)
http和https的区别?
http和https的区别?HTTPHTTPSHTTP与HTTPS区别HTTPS相比于HTTP协议的优点和缺点HTTP http是超文本传输协议 HTTP协议是基于传输层的TCP协议进行通信,通用无状态的协议。80端口 HTTPS https—安全的超文本传输协议 是以安全为目标的HTTP通道,…...
![](https://img-blog.csdnimg.cn/b992cc7067294b77b4420411b3d6e7d1.png)
【Spring Cloud Alibaba】4.创建服务消费者
文章目录简介开始搭建创建项目修改POM文件添加启动类添加配置项添加Controller添加配置文件启动项目测试访问Nacos访问接口查看端点检查简介 接下来我们创建一个服务消费者,本操作先要完成之前的步骤,详情请参照【Spring Cloud Alibaba】Spring Cloud A…...
![](https://img-blog.csdnimg.cn/cf214be6efa24ba8a7d92550aa1ec88b.png)
C语言——动态内存管理 malloc、calloc、realloc、free的使用
目录 一、为什么存在动态内存分配 二、动态内存函数的介绍 2.1malloc和free 2.2calloc 2.3realloc 三、常见的动态内存错误 3.1对NULL指针的解引用操作 3.2对动态开辟空间的越界访问 3.3对非动态开辟的内存使用free释放 3.4使用free释放一块动态开辟内存的一部分 3.5…...
![](https://img-blog.csdnimg.cn/202bf9370c0d4fad86b5131406be8072.png)
技术分享——Java8新特性
技术分享——Java8新特性1.背景2. 新特性主要内容3. Lambda表达式4. 四大内置核心函数式接口4.1 Consumer<T>消费型接口4.2 Supplier<T>供给型接口4.3 Function<T,R>函数型接口4.4 Predicate<T> 断定型接口5. Stream流操作5.1 什么是流以及流的类型5.2…...
![](https://www.ngui.cc/images/no-images.jpg)
vue基础知识大全
1,指令作用 以v-开头,由vue提供的attribute,为渲染DOM应用提供特殊的响应式行为,也即是在表达式的值发生变化的时候响应式的更新DOM。其内容为可以被求值的js代码,可以写在return后面被返回的表达式。 指令的简写指令简…...
![](https://img-blog.csdnimg.cn/b0f0bff7aca94ffbb7203bc01a43c374.png)
第2篇|文献研读|nature climate change|减缓气候变化和促进热带生物多样性的碳储量走廊
研究背景 从 2000 年到 2012 年,潮湿和干燥热带地区的森林总损失超过 90,000 平方公里 yr-1,这主要是由农业扩张驱动的。热带森林砍伐向大气中排放 0:95 Pg C yr-1 并导致广泛的生物多样性丧失。保护区的生物多样性取决于与保护区所在的更广泛景观的生态…...
![](https://img-blog.csdnimg.cn/img_convert/532108f1df0075b28e8890d6b9d70a71.png)
从暴力递归到动态规划(2)小乖,你也在为转移方程而烦恼吗?
前引:继上篇我们讲到暴力递归的过程,这一篇blog我们将继续对从暴力递归到动态规划的实现过程,与上篇类似,我们依然采用题目的方式对其转化过程进行论述。上篇博客:https://blog.csdn.net/m0_65431718/article/details/…...
![](https://www.ngui.cc/images/no-images.jpg)
Leetcode.1638 统计只差一个字符的子串数目
题目链接 Leetcode.1638 统计只差一个字符的子串数目 Rating : 1745 题目描述 给你两个字符串 s和 t,请你找出 s中的非空子串的数目,这些子串满足替换 一个不同字符 以后,是 t串的子串。换言之,请你找到 s和 t串中 恰…...
![](https://img-blog.csdnimg.cn/5a285a08269749caaecced56648116fb.png)
KoTime:v2.3.9新增线程管理(线程统计、状态查询等)
功能概览 KoTime的开源版本已经迭代到了V2.3.9,目前功能如下: 实时监听方法,统计运行时长web展示方法调用链路,瓶颈可视化追踪追踪系统异常,精确定位到方法接口超时邮件通知,无需实时查看线上热更新&…...
![](https://img-blog.csdnimg.cn/ce1dfec2e8084eb7b67689326637c038.png)
直面风口,未来不仅是中文版ChatGPT,还有AGI大时代在等着我们
说到标题的AI2.0这个概念的研究早在2015年就研究起步了,其实大家早已知道,人工智能技术必然是未来科技发展战略中的重要一环,今天我们就从AI2.0入手,以GPT-4及文心一言的发布为切入角度,来谈一谈即将降临的AGI时代。 关…...
![](https://img-blog.csdnimg.cn/9c9001627740413eaac8fba363fc4cc6.png)
若依微服务(ruoyi-cloud)保姆版容器编排运行
一、简介 项目gitee地址:https://gitee.com/y_project/RuoYi-Cloud 由于该项目运行有很多坑,大家可以在git克隆拷贝到本地后,执行下面的命令使master版本回退到本篇博客的版本: git reset --hard 05ca78e82fb4e074760156359d09a…...
![](https://img-blog.csdnimg.cn/e0950d57d0f149809560053994cea79e.gif#pic_center)
vue2图片预览插件
学习:vue插件开发实例-图片预览插件 vue2-pre-img-plugin的gitee代码 准备工作 准备图片与基础的样式 将iconfont下载的字体图标资源放在src/assets/iconfont目录下将准备预览的图片放到src/static/images目录下 PrevImg.vue 在plugins/PrevImg目录下ÿ…...
![](https://www.ngui.cc/images/no-images.jpg)
手写Promise源码的实现思路
Promise的使用: let promise new Promise((resolve, reject) > {resolve("OK");// reject("Error"); });console.log(promise);promise.then(value > {console.log("success"); }, error > {console.log("fail"…...
![](https://img-blog.csdnimg.cn/43a958f730f640c38e3b7c0827e2ddca.jpeg)
【数据结构】-关于树的概念和性质你了解多少??
作者:小树苗渴望变成参天大树 作者宣言:认真写好每一篇博客 作者gitee:gitee 如 果 你 喜 欢 作 者 的 文 章 ,就 给 作 者 点 点 关 注 吧! 树前言一、树概念及结构1.1树的概念1.2 树的相关概念1.3 树的表示1.4树在实际中的运用…...
![](https://img-blog.csdnimg.cn/09d3697853a742b88b67892104483722.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5a2Z5LiN5Z2aMTIwOA==,size_20,color_FFFFFF,t_70,g_se,x_16#pic_center)
【前端之旅】NPM必知必会
一名软件工程专业学生的前端之旅,记录自己对三件套(HTML、CSS、JavaScript)、Jquery、Ajax、Axios、Bootstrap、Node.js、Vue、小程序开发(UniApp)以及各种UI组件库、前端框架的学习。 【前端之旅】Web基础与开发工具 【前端之旅】手把手教你安装VS Code并附上超实用插件…...
![](https://www.ngui.cc/images/no-images.jpg)
Android SQLite使用事务来确保所有语句都以原子方式执行及保证数据完整性一次执行多条语句示例
execSQL 不支持用分号分隔一次执行多个 SQL 语句,虽然理论上可以实现。但是,并不建议这样做,因为这可能会导致潜在的 SQL 注入漏洞。相反,建议使用 execSQL 或 rawQuery 分别执行每个语句。 在下面的代码块中,我们正在…...
![](https://img-blog.csdnimg.cn/92c3afdcc9af4004a3a86203dd912b84.jpeg)
nodejs+vue校园超市小卖部零食在线购物商城系统
21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存储达到…...
![](https://img-blog.csdnimg.cn/img_convert/2d8d44e514ab0e2ac15eaefe7161a3cd.jpeg)
Karl Guttag:论相机对焦技术在AR/VR中的沿用
近期,AR/VR光学专家Karl Guttag介绍了两家在CES 2023展出光学传感技术的公司:poLight和CML(剑桥机电一体化)。同时介绍两家公司的原因,是因为他们提供了实现AR/VR“光学微动”(Optics Micromovement&…...
![](https://img-blog.csdnimg.cn/img_convert/ebcb83f460d7494c647c82e7c279b691.png)
ECL@SS学习笔记(3)-概念数据模型
ECLSS 是产品,服务的分类和描述系统。本文介绍其内部的数据模型。ECLSS的作用ECLSS 标准的目标是为了实现工业界数据交换的标准化。这个标准主要作用是产品的分类和描述。分类为了有效地物料管理,供应链管理和电子商务,需要对物料进行分类和编…...
![](https://www.ngui.cc/images/no-images.jpg)
206. 反转链表
给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 示例 2: 输入:head [1,2] 输出:[2,1] 示例 3: 输…...
![](https://img-blog.csdnimg.cn/6f0c6dcff284477b8d28fa3526c95f37.png#pic_center)
文心一言 vs GPT-4 —— 全面横向比较
文心一言 vs GPT-4 —— 全面横向比较 3月15日凌晨,OpenAI发布“迄今为止功能最强大的模型”——GPT-4。我第一时间为大家奉上了体验报告《OpenAI 发布GPT-4——全网抢先体验》。 时隔一日,3月16日下午百度发布大语言模型——文心一言。发布会上&#…...
![](https://www.ngui.cc/images/no-images.jpg)
rancher2.6进阶之kubectl安装
rancher2.6进阶之kubectl安装 1.安装kubectl客户端 1.1.1.使用命令行下载安装包: curl -LO https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl Note: 可指定下载版本, 将 ( c u r l − L − s h t t p s : / / d l . k …...
![](https://img-blog.csdnimg.cn/img_convert/2d13aa9a455aefc53c3d1814634a15dc.png)
图像基本变换
缩放与裁剪裁剪图像的裁剪,是指将图像的某个区域切割出来。一些常见的应用场景包括:* 感兴趣区域提取* 去除无用信息* 图像增强* 纠偏:去除不规则部分,将图像变得更加整齐事实上,图像裁剪的裁剪通常就是一个numpy矩阵切…...
![](https://img-blog.csdnimg.cn/img_convert/07d6762d3491ecbcb67866b116c2f6e6.png)
基于文心一言的底层视觉理解,百度网盘把「猫」换成了「黄色的猫」
随着移动互联网的一路狂飙,手机已经成为人们的新器官。出门不带钥匙可以,不带手机却是万万不可以的。而手机上,小小的摄像头也越来越成为各位「vlogger」的口袋魔方。每天有超过数亿的照片和视频被上传到百度网盘中,这些照片和视频…...
![](https://img-blog.csdnimg.cn/011b1ec76eca4d64aed4fc626807e94e.png#pic_center)
安卓开发的环境配置教程
文章目录事先准备:下载 JDK、Gradle下载安装 Android Studio下载安装 Android SDK下载安装 ADB笔者的环境: Java 17.0.1 Gradle 8.0.1 Android Studio Electric Eel | 2022.1.1 Patch 1 Windows 10 教育版 64位 事先准备:下载 JDK、Gradl…...
![](/images/no-images.jpg)
a公司备案做b公司网站/手机百度识图网页版入口
《大学计算机基本》试题题库及答案一、单选题练习1.完整计算机系统由( C )构成。A.运算器、控制器、存储器、输入设备和输出设备B.主机和外部设备C.硬件系统和软件系统D.主机箱、显示屏、键盘、鼠标、打印机2&#x…...
![](/images/no-images.jpg)
网站建设及规划方案/百度浏览器网页
亲密---我感觉,可以用和人和事处的时间长短,并用心 难?不去做? 前作业: 1.什么是微服务 将整个项目,按照功能拆分,拆分后能够更容易地部署,扩展,没有技术壁垒 2.微服务用什么优势,go或者py去做,怎么实现 …...
![](/images/no-images.jpg)
wordpress更新慢/百度在线翻译
计算机VB基础知识---知识导学VB基础知识---知识导学Viscal Basic语言一.算法1.定义:算法(Algorithm)就是解决某一类问题的方法和步骤。2.算法的五个重要特征:(1)输入:可以是0个或多个输入;算法可以没有输入。(2)输出:可…...
![](https://img-blog.csdnimg.cn/99ade00b7ba14817960089df51eea204.png)
楼盘网站建设方案ppt/最新免费网站收录提交入口
selenium这个工具就不用我多介绍了吧,咱们已经说过很多很多次咯,所以就直接上主题: — 1 — 窗口截图 webdriver 提供了 get_screenshot_as_file()函数来截取当前窗口 from selenium import webdriver from time import sleepdriver web…...
![](/images/no-images.jpg)
网站数据表怎么做/自媒体培训学校
旅游与每个人的生活息息相关,旅游产业也亟需一种脱胎换骨的方式提升效益。在近日第15届中国互联网大会“互联网民航”专场上,梦想旅行CEO郭宁表示,大数据将改变传统旅游行业的DNA,加速推动智慧旅游时代的到来。 大数据打破旅游信息…...
![](https://static001.infoq.cn/resource/image/30/cb/30b5375ed21be2b7cb3f1e11f1df9dcb.jpg)
大连筑成建设集团有限公司网站/推广策略可以分为哪三种
最近Android 6.0版本的源代码开放下载,刚好分析Android源码的技术书籍《Android源码设计模式解析与实战》上市,我们邀请到它的作者何红辉,来谈谈Android源码中的设计模式,以及近期Android开发中的一些热点话题。\\受访嘉宾介绍&am…...