Python爬虫:请求负载和表单数据有什么区别

  介绍

小编这次要给大家分享的是Python爬虫:请求负载和表单数据有什么区别,文章内容丰富,感兴趣的小伙伴可以来了解一下,希望大家阅读完这篇文章之后能够有所收获。

请求负载和表单数据请求头上的参数差别在于:

内容类型表单数据

<强>文章表单请求

代码示例

 

<>强传递json数据

 

Scrapy的FormRequest只支持表单数据表单提交,源码固定为前者

<>强如何传递请求负载(请求负载)中的数据?

在做爬虫的时候,在分析请求的过程,遇到参数长这样的:

原理不太清楚,等搞明白再来补充。这里只记录如何应用这些数据。

<强>用法:

根据上面的图片,由于是帖子请求,参数一般是以键-值的json字符串传递,或者将参数放入地图传递,我们可以看到很多的名字,这就个名字是关键,下面的数据就是价值,我们可以提取所有的关键及价值,组成一个json字符串或者地图传递即可。

比如上面的数据可以提取如下:

{“视图:id1: txtSearch":““,“$ $ viewid":“! f9fpyhcv2t !“,“$ $ xspsubmitid":“观点:_id1: _id2: pager1_Group_lnk_2",“$ $ xspexecid":“观点:_id1: _id2: parent",“$ $ xspsubmitvalue":““,“$ $ xspsubmitscroll":“| 0“,“视图:_id1":“观点:_id1"}

或者:

 

由于我是用Jsoup来发请求的,所以我这样传参数即可:

Jsoup.connect (“;”) . data (m) .cookies (null) .method (Method.POST);

或者:

连接康涅狄格州=Jsoup.connect (“;”);
  字符串requestJson=皗\“视图:id1: txtSearch \“: \“\”, \“$ $ viewid \“: \“! f9fpyhcv2t ! \”, \“$ $ xspsubmitid \“: \“视图:_id1: _id2: pager1_Group_lnk_2 \”, \“$ $ xspexecid \“: \“视图:_id1: _id2:父母\“,\“$ $ xspsubmitvalue \“: \“\”, \“$ $ xspsubmitscroll \“: \“0 | 0 \”, \“视图:_id1 \“: \“视图:_id1 \“}”;
  conn.requestBody (requestJson);
  conn.cookies (null) .method (Method.POST);
  conn.execute (); 

具体参数具体情况填啦。

是不是超简单。

注意一点,请求负载中值的值不一定是固定值,若每次请求都会发生变化,那么就需要分析这个变化的值从哪里来,动态获取这个值,然后发送请求才能正确。

看完这篇关于Python爬虫:请求负载和表单数据有什么区别的文章,如果觉得文章内容写得不错的话,可以把它分享出去给更多人看到。

Python爬虫:请求负载和表单数据有什么区别