urlparse模块(python模块) - 行业资讯 - 肥雀云_南京肥雀信息技术有限公司

一、urlparse模块简介

,,,, urlparse模块主要是把url拆分为6部分,并返回元组。并且可以把拆分后的部分再组成一个url。主要有函数有urljoin, urlsplit, urlunsplit, urlparse等。

二,urljoin函数使用

,,,, urljoin主要是拼接url,它以基地作为其基地址,然后与url中的相对地址相结合组成一个绝对url地址。函数urljoin在通过为url基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用。需要注意的是,如果基地址并非以字符/结尾的话,那么url基地址最右边部分就会被这个相对路径所替换。如果希望在该路径中保留末端目录,应确保url基地址以字符/结尾。

输入代码:

 import  urlparse
　　
　　# urljoin函数是合并域名和相对路径的
　　时间=urljoin  urlparse.urljoin (“http://www.sina.cn/cc”,“文件/down.php”)
　　print  urljoin
　　
　　时间=urljoin1  urlparse.urljoin (“http://www.sina.cn/cc/?“文件/down.php”)
　　print  urljoin1

代码运行结果:

C: \ Python27 \ python。exe C:/用户/李/桌面/d/PycharmProjects/untitled/test.py http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php

三,urlparse函数和urlsplit函数使用

,,主要是分析urlstring,返回一个包含5个字符串项目的元组:协议,位置,路径,查询,片段.allow_fragments为假时,该元组的组后一个项目总是空,不管urlstring有没有片段,省略项目的也是空.urlsplit()和urlparse()差不多

输入代码:

代码运行结果:

C: \ Python27 \ python。exe C:/用户/李/桌面/d/PycharmProjects/untitled/测试。py

SplitResult(计划=癶ttp”netloc=' www.baidu.com ',路径='/好/索引。php”,查询=' id=18”,片段=")

www.baidu.com http

/好/index . php

id=18