python爬虫中cookie的操作示例

  介绍

这篇文章将为大家详细讲解有python爬关虫中cookie的操作示例,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

python是什么意思

python是一种跨平台的,具有解释性,编译性,互动性和面向对象的脚本语言,其最初的设计是用于编写自动化脚本,随着版本的不断更新和新功能的添加,常用于用于开发独立的项目和大型项目。

python爬虫在客户端访问Web服务器时,服务器可以根据cookie来跟踪客户状态,这对于需要区别客户的场合(如电子商务)特别有用.cookie存在与缓存中或者硬盘中,在硬盘中的是一些文本文件,当你访问该网站时,就会读取对应的网站的饼干信息。

<强> 1,饼干的格式:

 set - cookie:, NAME=价值;/信息=到期日期;路径=路径;域=DOMAIN_NAME;安全

<强>参数意义:

名称:饼干的名字。

值:cookie的值。

到期:饼干的过期时间。

路径:饼干作用的路径。该饼干是在当前的哪个路径下生成的,如路径=/wp-admin。

域:饼干作用的域名。

安全:是否只在https协议下起作用。如果设置了这个属性,那么只会在SSH连接时才会回传该cookie

<强> 2,饼干机制

当用户第一次访问并登陆一个网站的时候,饼干的设置以及发送会经历以下4个步骤:

客户端发送一个请求到服务器,——》,服务器发送一个HttpResponse响应到客户端,其中包含set - cookie的头部,——》,客户端保存cookie,之后向服务器发送请求时,HttpRequest请求中会包含一个cookie的头部,——》服务器返回响应数据。

<强> 3,饼干实例:从本地加载饼干

从本地加载cookie,需要使用cookiejar负载的方法,并且也需要指定方法:

<>之前得到urllib  import 请求,解析   得到http.cookiejar  import  MozillaCookieJar   ,   #加载本地饼干   #保存饼干到本地文件   cookiejar1=MozillaCookieJar (& # 39; cookie.txt& # 39;)   cookiejar1.load (ignore_discard=True)   处理程序=request.HTTPCookieProcessor (cookiejar)   刀=request.build_opener(处理器)   ,   resp=opener.open (& # 39; http://httpbin.org/cookies& # 39;)   ,   for  cookie  cookiejar1拷贝:,,#将饼干打印到控制台   ,,,印刷(饼干)

python爬虫中cookie的操作示例