介绍
小编给大家分享一下Python中请求怎样获取网页,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!
Python有哪些常用库
Python常用的库:1. requesuts; 2. scrapy; 3.枕头;4.扭曲;5. numpy; 6. matplotlib; 7. pygama; 8。ipyhton等。
主要记录使用请求模块获取网页源码的方法
class 履带(对象): ,“““ ,采集类 ,“““ ,def __init__(自我,,base_url): self._base_url 才能=base_url 时间=self._cookie 才能;没有 self._getCookie才能() ,def _getCookie(自我): “才能”;“ 获才能取站点饼干 ,,:返回: “才能”;“ 尝试才能: ,,res =, requests.get (self._base_url) ,,res.raise_for_status () ,,#,TODO response.cookies获取到的是一个cookiejar对象,需要使用requests.utils.dict_from_cookiejar来 ,,#,TODO 将cookiejar对象转换为一个字典,这个字典后续使用的时候,在请求时直接传入就可以了, ,,#,如,requests.get (url,饼干=饼干) ,,self._cookie =, requests.utils.dict_from_cookiejar (res.cookies) ,,print self._cookie except 才能;Exception  as e: ,,print e ,def get_html_text(自我,,url,, * * kwargs): “才能”;“ 爬才能取网页的通用代码框架 ,,:param url: ,,:param 方法: :才能param kwargs: ,,:返回: “才能”;“ 尝试才能: ,,kwargs.setdefault(& # 39;饼干# 39;,,self._cookie) ,,res =, requests.get (url, * * kwargs) ,,#,TODO 若响应状态码不是200年,抛出,HTTPError 异常 ,,res.raise_for_status () ,,res.encoding =res.apparent_encoding ,,#,print requests.utils.dict_from_cookiejar (res.cookies) ,,return res.text except 才能;Exception  as e: ,,print traceback.print_exc () ,才能回归
以上是“Python中请求怎样获取网页”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!