怎么对scrapy头部进行修改

  介绍

这篇文章将为大家详细讲解有关怎么对scrapy头部进行修改,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

在没有任何配置的情况下,scrapy会对请求默认加上一些头部信息

scrapy会通过配置文件中的USER_AGENT配置,自动为头部添加用户代理,这条配置会被任何包含用户代理的配置覆盖

怎么对scrapy头部进行修改

当请求经过下载器后,会被自动添加头部接受编码:gzip、缩小,会被任意包含接受编码的头部配置覆盖

 # DEFAULT_REQUEST_HEADERS={
  # & # 39;接受# 39;:& # 39;text/html, application/xhtml + xml应用程序/xml; q=0.9 */*; q=0.8 & # 39;
  # & # 39;接收语言# 39;:& # 39;en # 39;
  #}

当这个配置属于注释状态时,头部被设置为接受:text/html, application/xhtml + xml应用程序/xml; q=0.9 */*; q=0.8与
接收语言:嗯,可以通过取消注释修改或增删其中的内容

优先级

    <李>会被请求和中间件中的头部配置覆盖李 <李>可以覆盖scrapy自动添加的用户代理和接受编码
      李,

可以在爬虫中通过custom_settings设置配置仅在当前爬虫生效

类XXXSpider (scrapy.Spider):
  …
  custom_settings={
  DEFAULT_REQUEST_HEADERS={…}
  }
  …

当给引擎返回请求时,可以为他配置头部

…   def解析(自我):   头={   …   }      收益率scrapy。请求(url,标题=头)

优先级

    <李>请求中设置的头会和settings.py文件中的默认头部合并到一起,如果有重复的配置,那么会覆盖那条配置李 <>李会被中间件中的配置覆盖
      李,

当请求请求通过下载中间件发往下载器时,可以通过下载中间件配置头部

类XXXDownloaderMiddleware
  def process_request(自我,请求,蜘蛛):
  request.headers [“key"]=价值
  返回所有

还需要在配置文件中启用下载中间价

 DOWNLOADER_MIDDLEWARES={
  & # 39;project.middlewares.XXXDownloaderMiddleware& # 39;: 543,
  }

优先级

    <李>会覆盖除了推荐人以外的所有头部配置
      李,

当存在多次请求时,推荐人中间件会自动帮请求的头部中的推荐人加上上一次请求的url

优先级

    <李>最高,会在所有头部配置完之后,添加推荐人李 <李>除了只请求一次没有推荐人的情况,就算在其他头部配置中设置了推荐人也会被推荐人中间件覆盖
      李,

关闭推荐人中间件

在配置文件中添加REFERER_ENABLED=False即可关闭

Scrapy自动添加的用户代理与接受编码& lt;配置文件中的默认配置DEFAULT_REQUEST_HEADERS & lt;请求中修改的头& lt;中间件中添加的头& lt;推荐人中间件添加的引用页

关于怎么对scrapy头部进行修改就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。

怎么对scrapy头部进行修改