最近在学习python爬虫,看到网上有很多关于模拟豆瓣登录的例子,随意找了一个试了下,发现不能运行,对比了一下代码和豆瓣网站,发现原来是豆瓣网站做了修改,增加了反爬措施。
首先看下要模拟登录的网站:
打开开发者模式:
在账号和密码随意填入数据:
发现会发送一个帖子请求:
你是:https://accounts.douban.com/j/mobile/login/basic
数据格式是:
于是可以来编写代码:
进口的要求 def main (): url_basic=' https://accounts.douban.com/j/mobile/login/basic ' url=' https://www.douban.com/' ua_headers={“用户代理”:“Mozilla/4.0(兼容;MSIE 8.0;Windows NT 6.0;三叉戟/4.0)'} data=https://www.yisu.com/zixun/{ck:”, “名称”:“自己的账号”, “密码”:“自己的密码”, “记得”:“假”, “票”:“ } s=requests.session () 年代。帖子(url=url_basic头=ua_headers, data=https://www.yisu.com/zixun/data) 响应=et (url=url,标题=ua_headers) 张开(“豆瓣。html”、“白平衡”)f: f.write (response.content) if __name__==癬_main__”: main ()
第一步:
创建s=requests.session ()
作用是跨请求保持参数,也就是说年代这个会议对象所发出的所有请求之间会保持饼干
第二步:
用创建好的会话对象携带账号:密码去发送帖子请求。
由于改版后的豆瓣返回的是一个josn数据,而不是像以前一样重定向,所以需要我们来重定向。
第三步:
携带登录成功保存的饼干去访问首页,就会得到你自己的首页。
最后得到个人首页:
以上所述是小编给大家介绍的python模拟豆瓣登录详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留的言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!