小编这次要给大家分享的是Python爬虫:请求负载和表单数据有什么区别,文章内容丰富,感兴趣的小伙伴可以来了解一下,希望大家阅读完这篇文章之后能够有所收获。
请求负载和表单数据请求头上的参数差别在于:
内容类型表单数据
引用>
<强>文章表单请求强>
代码示例
<>强传递json数据强>
Scrapy的FormRequest只支持表单数据表单提交,源码固定为前者
<>强如何传递请求负载(请求负载)中的数据? 强>
在做爬虫的时候,在分析请求的过程,遇到参数长这样的:
原理不太清楚,等搞明白再来补充。这里只记录如何应用这些数据。
<强>用法:强>
根据上面的图片,由于是帖子请求,参数一般是以键-值的json字符串传递,或者将参数放入地图传递,我们可以看到很多的名字,这就个名字是关键,下面的数据就是价值,我们可以提取所有的关键及价值,组成一个json字符串或者地图传递即可。
比如上面的数据可以提取如下:
{“视图:id1: txtSearch":““,“$ $ viewid":“! f9fpyhcv2t !“,“$ $ xspsubmitid":“观点:_id1: _id2: pager1_Group_lnk_2",“$ $ xspexecid":“观点:_id1: _id2: parent",“$ $ xspsubmitvalue":““,“$ $ xspsubmitscroll":“| 0“,“视图:_id1":“观点:_id1"}
引用>或者:
由于我是用Jsoup来发请求的,所以我这样传参数即可:
Jsoup.connect (“;”) . data (m) .cookies (null) .method (Method.POST);
引用>或者:
连接康涅狄格州=Jsoup.connect (“;”); 字符串requestJson=皗\“视图:id1: txtSearch \“: \“\”, \“$ $ viewid \“: \“! f9fpyhcv2t ! \”, \“$ $ xspsubmitid \“: \“视图:_id1: _id2: pager1_Group_lnk_2 \”, \“$ $ xspexecid \“: \“视图:_id1: _id2:父母\“,\“$ $ xspsubmitvalue \“: \“\”, \“$ $ xspsubmitscroll \“: \“0 | 0 \”, \“视图:_id1 \“: \“视图:_id1 \“}”; conn.requestBody (requestJson); conn.cookies (null) .method (Method.POST); conn.execute ();具体参数具体情况填啦。
是不是超简单。
注意一点,请求负载中值的值不一定是固定值,若每次请求都会发生变化,那么就需要分析这个变化的值从哪里来,动态获取这个值,然后发送请求才能正确。
看完这篇关于Python爬虫:请求负载和表单数据有什么区别的文章,如果觉得文章内容写得不错的话,可以把它分享出去给更多人看到。
Python爬虫:请求负载和表单数据有什么区别