详解Python3网络爬虫(二):利用urllib.urlopen向有道翻译发送数据获得翻译结果 - 行业资讯

上一篇内容,已经学会了使用简单的语句对网页进行抓取。接下来,详细看下urlopen的两个重要参数url和数据,学习如何发送数据数据

url不仅可以是一个字符串,例如:http://www.baidu.com.url也可以是一个请求对象,这就需要我们先定义一个请求对象,然后将这个请求对象作为urlopen的参数使用,方法如下:

　　　　　　# - * -编码:utf - 8 - * 　　从urllib导入请求　　　　if __name__==癬_main__”: 　　要求=request.Request (“http://fanyi.baidu.com/? 　　响应=request.urlopen(要求) 　　html=response.read () 　　html=html.decode (“utf - 8”) 　　打印(html) 　　之前　　　　

同样,运行这段代码同样可以得到网页信息。可以看一下这段代码和上个笔记中代码的不同,对比一下就明白了。

urlopen()返回的对象,可以使用读()进行读取,同样也可以使用geturl()方法,信息()方法,getcode()方法。

详解Python3网络爬虫(二):利用urllib.urlopen向有道翻译发送数据获得翻译结果

geturl()返回的是一个url的字符串;

info()返回的是一些元标记的元信息,包括一些服务器的信息;

getcode()返回的是HTTP的状态码,如果返回200表示请求成功。

关于元标签和HTTP状态码的内容可以自行百度百科,里面有很详细的介绍。

详解Python3网络爬虫(二):利用urllib.urlopen向有道翻译发送数据获得翻译结果

了解到这些,我们就可以进行新一轮的测试,新建文件名urllib_test04.py,编写如下代码:

　　　　　　# - * -编码:utf - 8 - * 　　从urllib导入请求　　　　if __name__==癬_main__”: 　　要求=request.Request (“http://fanyi.baidu.com/? 　　响应=request.urlopen(要求) 　　打印(“geturl打印信息:% s“% (response.geturl ())) 　　打印(“* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *’) 　　打印(“信息打印信息:% s“% (response.info ())) 　　打印(“* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *’) 　　打印(“getcode打印信息:% s“% (response.getcode ())) 　　之前　　　　

可以得到如下运行结果:

详解Python3网络爬虫(二):利用urllib.urlopen向有道翻译发送数据获得翻译结果