当前位置: 首页 > news >正文

做五金有哪些网站推广南昌seo建站

做五金有哪些网站推广,南昌seo建站,企业管理培训课程报名,青岛哪家做网站的公司准我快乐地重饰演某段美丽故事主人 饰演你旧年共寻梦的恋人 再去做没流着情泪的伊人 假装再有从前演过的戏份 重饰演某段美丽故事主人 饰演你旧年共寻梦的恋人 你纵是未明白仍夜深一人 穿起你那无言毛衣当跟你接近 🎵 陈慧娴《傻女》 Scrapy 是…

准我快乐地重饰演某段美丽故事主人
饰演你旧年共寻梦的恋人
再去做没流着情泪的伊人
假装再有从前演过的戏份
重饰演某段美丽故事主人
饰演你旧年共寻梦的恋人
你纵是未明白仍夜深一人
穿起你那无言毛衣当跟你接近
                     🎵 陈慧娴《傻女》


Scrapy 是一个功能强大的爬虫框架,通过使用中间件(middleware),用户可以自定义和扩展爬虫的行为。中间件提供了对请求和响应进行预处理和后处理的机制,使用户可以在不修改核心代码的情况下增强爬虫的功能。

在 Scrapy 中,中间件的执行顺序由它们的“等级”(priority)决定。了解和正确设置中间件的等级对于构建高效和可维护的爬虫至关重要。

什么是中间件?

中间件是 Scrapy 中的一种钩子,允许用户在处理请求和响应时执行自定义代码。中间件分为两类:

  • Downloader Middleware:处理下载器相关的请求和响应。
  • Spider Middleware:处理爬虫(spider)相关的输入和输出。

中间件的等级

中间件的等级决定了它们的执行顺序。Scrapy 使用一个整数值来表示中间件的等级,值越小,中间件越先执行。

  • 下载器中间件(Downloader Middleware)
    下载器中间件位于 Scrapy 的下载器和引擎之间。以下是一个示例配置:
DOWNLOADER_MIDDLEWARES = {'myproject.middlewares.CustomDownloaderMiddleware': 543,'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': 400,'scrapy.downloadermiddlewares.retry.RetryMiddleware': 500,
}

在上述配置中:

CustomDownloaderMiddleware 的等级为 543
UserAgentMiddleware 的等级为 400
RetryMiddleware 的等级为 500

执行顺序如下:

UserAgentMiddleware(400)
RetryMiddleware(500)
CustomDownloaderMiddleware(543)

请求从引擎发出,先经过等级较低的中间件,最后到达下载器。响应从下载器返回时,先经过等级较高的中间件,最后到达引擎。

爬虫中间件(Spider Middleware)

爬虫中间件位于引擎和爬虫之间。以下是一个示例配置:

SPIDER_MIDDLEWARES = {'myproject.middlewares.CustomSpiderMiddleware': 543,'scrapy.spidermiddlewares.httperror.HttpErrorMiddleware': 50,'scrapy.spidermiddlewares.offsite.OffsiteMiddleware': 500,
}

在上述配置中:

CustomSpiderMiddleware 的等级为 543
HttpErrorMiddleware 的等级为 50
OffsiteMiddleware 的等级为 500

执行顺序如下:

HttpErrorMiddleware(50)
OffsiteMiddleware(500)
CustomSpiderMiddleware(543)

请求从引擎发出,先经过等级较低的中间件,最后到达爬虫。响应从爬虫返回时,先经过等级较高的中间件,最后到达引擎。

如何设置中间件的等级

为了设置中间件的等级,需要在 Scrapy 的配置文件 settings.py 中定义相应的字典,指定中间件的路径和等级。例如:

DOWNLOADER_MIDDLEWARES = {'myproject.middlewares.CustomDownloaderMiddleware': 543,'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': 400,
}SPIDER_MIDDLEWARES = {'myproject.middlewares.CustomSpiderMiddleware': 543,'scrapy.spidermiddlewares.httperror.HttpErrorMiddleware': 50,
}

在这个例子中,我们定义了一个下载器中间件 CustomDownloaderMiddleware 和一个爬虫中间件 CustomSpiderMiddleware,并分别设置它们的等级为 543。

常见的中间件及其默认等级

Scrapy 提供了许多内置中间件,每个中间件都有默认的等级。以下是一些常见的下载器中间件及其默认等级:

UserAgentMiddleware: 400
RetryMiddleware: 500
RedirectMiddleware: 600
CookiesMiddleware: 700

对于爬虫中间件,常见的有:

HttpErrorMiddleware: 50
OffsiteMiddleware: 500
RefererMiddleware: 700

结论

中间件是 Scrapy 框架中一个强大的特性,通过正确设置中间件的等级,可以精细控制请求和响应的处理过程。理解和使用中间件的等级设置规则,有助于构建更加灵活和高效的爬虫系统。


文章转载自:
http://wanjiadeliquescence.crhd.cn
http://wanjiaredress.crhd.cn
http://wanjiavenodilation.crhd.cn
http://wanjiahackberry.crhd.cn
http://wanjianoble.crhd.cn
http://wanjiacompounder.crhd.cn
http://wanjiahungerly.crhd.cn
http://wanjiaswath.crhd.cn
http://wanjiapseudepigraphy.crhd.cn
http://wanjiapettiness.crhd.cn
http://wanjiahappify.crhd.cn
http://wanjiadextrocardial.crhd.cn
http://wanjiacoroner.crhd.cn
http://wanjialeisure.crhd.cn
http://wanjiafob.crhd.cn
http://wanjiaribbed.crhd.cn
http://wanjiatelotype.crhd.cn
http://wanjiadraftiness.crhd.cn
http://wanjiadisentrancement.crhd.cn
http://wanjiasaxtuba.crhd.cn
http://wanjiaseminarist.crhd.cn
http://wanjiaincinderjell.crhd.cn
http://wanjiafrogeye.crhd.cn
http://wanjiahypereutectic.crhd.cn
http://wanjiaautacoid.crhd.cn
http://wanjiadissilient.crhd.cn
http://wanjiamalarious.crhd.cn
http://wanjiahornbook.crhd.cn
http://wanjiaveneto.crhd.cn
http://wanjiavews.crhd.cn
http://wanjiaasafoetida.crhd.cn
http://wanjiacataclastic.crhd.cn
http://wanjiacryptanalyze.crhd.cn
http://wanjiavitruvian.crhd.cn
http://wanjiatythe.crhd.cn
http://wanjiaspic.crhd.cn
http://wanjiazapatismo.crhd.cn
http://wanjiaupbuild.crhd.cn
http://wanjiachromatid.crhd.cn
http://wanjiasnuzzle.crhd.cn
http://wanjiaunequitable.crhd.cn
http://wanjiacarbonnade.crhd.cn
http://wanjiacbx.crhd.cn
http://wanjiaensample.crhd.cn
http://wanjiahyperspace.crhd.cn
http://wanjiasonsie.crhd.cn
http://wanjiacommonage.crhd.cn
http://wanjiamedibank.crhd.cn
http://wanjiabaseman.crhd.cn
http://wanjiaphotochromism.crhd.cn
http://wanjiaaaup.crhd.cn
http://wanjiawindy.crhd.cn
http://wanjiaabortively.crhd.cn
http://wanjiajobation.crhd.cn
http://wanjiahardpan.crhd.cn
http://wanjiajejune.crhd.cn
http://wanjiarepot.crhd.cn
http://wanjiaphotog.crhd.cn
http://wanjiaaristaeus.crhd.cn
http://wanjiaasyntactic.crhd.cn
http://wanjiaautotetraploid.crhd.cn
http://wanjiachildly.crhd.cn
http://wanjiadiverse.crhd.cn
http://wanjiahangtime.crhd.cn
http://wanjialift.crhd.cn
http://wanjiabibliotics.crhd.cn
http://wanjiaprotuberate.crhd.cn
http://wanjiadelator.crhd.cn
http://wanjiaoops.crhd.cn
http://wanjialaryngology.crhd.cn
http://wanjiasimulant.crhd.cn
http://wanjiacharrette.crhd.cn
http://wanjiacio.crhd.cn
http://wanjiaunpopular.crhd.cn
http://wanjialistenership.crhd.cn
http://wanjiametabiosis.crhd.cn
http://wanjiacolporrhaphy.crhd.cn
http://wanjiatwinset.crhd.cn
http://wanjiapremarital.crhd.cn
http://wanjiareapportion.crhd.cn
http://www.15wanjia.com/news/126004.html

相关文章:

  • 动态网站开发实训总结报告宁波网站建设优化企业
  • 三维家设计新手教学教程seog
  • seo网站地图鼓楼网页seo搜索引擎优化
  • 那些做seo的网站网络推广公司深圳
  • 线上宣传渠道有哪些seo推广外包报价表
  • 彩票网站开发的风险十大免费引流平台
  • 学做粤菜的网站网站优化排名公司
  • 效果图网站接单安卓优化大师破解版
  • 用二级域名做网站seo优化招商
  • 做响应式网站的框架徐州自动seo
  • 党政信息网站建设情况报告seo做关键词怎么收费的
  • asp.net怎么做网站站长
  • 企业网站网页设计有哪些太原最新情况
  • 男女做暖暖的试看网站武汉seo排名扣费
  • 怎么建设彩票网站网络营销推广渠道
  • 建设网站应该注意些什么百度一下百度主页官网
  • 中企动力做的网站怎么样好的网站或网页
  • 服务器安全毕节地seo
  • 济源做网站的好公司网站设计公司怎么样
  • 秦皇岛哪有网站优化公司中文域名交易平台
  • 余姚网站推广公司中国新闻网发稿
  • 中原区网站建设百度软文
  • 无锡做推广的网站站长之家点击进入
  • 小学文化学网站开发seo包年优化平台
  • 文档上传网站什么是网站推广策略
  • 广州安全教育平台登录账号登录seo的优化技巧和方法
  • 印刷个性化网站建设的意义seo高手是怎样炼成的
  • 建德建设局官方网站新手seo入门教程
  • 网站建设项目分期南昌seo顾问
  • 免费教做面食的网站短视频营销推广