这篇文章将为大家详细讲解有关通过抓包实现Python模拟登陆各网站的原理分析是怎样的,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
一、教程简介
1.1基本介绍(私信小编001年,002年,003年,007年任何一个即可获取Python学习资料)
通过分析登陆流程并使用Python实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践Python的网络编程,Python实现模拟登陆的方法,使用Firefox抓包分析插件分析网络数据包等知识。
模拟登录可以帮助用户自动化完成很多操作,在不同场合下有不同的用处,无论是自动化一些日常的繁琐操作还是用于爬虫都是一项很实用的技能。本课程通过Firefox和Python来实现,环境要求如下:
Python库:urllib, http。cookiejar, Django
Firefox 要求:装有 live http header插件 (已提供)
1.3 材料
1.4 准备
1) 安装抓包插件Live Http Headers
2)启动web应用
使用 ps -aux | grep codebox 查询获得 codebox 的进程号,然后使用 kill -9 进程号 停止 codebox 进程。执行过程见下图:
首先安装demo依赖的web框架django,并测试是否安装成功:
启动成功后在浏览器中输入 http://localhost:8000/polls 看到登录页面表示启动成功
二、分析登录过程
要通过编程实现登录,首先需要理解一般Web应用的登陆过程。
2.1 抓取请求
2.2原理分析
为什么是2个请求而不是1个呢?通过分析登录请求发现,登陆成功之后服务器发送了302重定向响应,服务器要求浏览器重新请求首页,这就产生了第二个请求。再来分析第二个请求,可以看到它相比登录请求多了一个请求头:
整个登录流程如下图所示:
服务器到底是如何区别不同用户的会话的?为什么登陆成功会后要回写饼干呢?