介绍
这篇文章运用简单易懂的例子给大家介绍怎么在Python中实现URL的解析,代码非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
在Python中的urlparse模块主要是用于解析URL中的参数,对url按照一定格式进行拆分或拼接,
<强> 1. urlparse。urlparse 强>
将url分为6个部分,返回一个包含6个字符串项目的元组:协议,位置,路径,参数,查询,片段。
import urlparse 时间=url_change urlparse.urlparse (& # 39; https://i.cnblogs.com/EditPosts.aspx?opt=1& # 39;) print url_change
输出结果为:
ParseResult(计划=& # 39;https # 39;,, netloc=& # 39; i.cnblogs.com& # 39;,,=& # 39;路径/EditPosts.aspx& # 39;,, params=& # 39; & # 39;,,查询=& # 39;选择=1 & # 39;,,片段=& # 39;& # 39;)
其中方案是协议,netloc是域名服务器,路径相对路径,参数是参数、查询是查询的条件
urlparse.parse_qs (urlparse.urlparse (url) .query)
这个是获取urlparse分割后元祖中的某一项,urlparse.urlparse (url) .query ,获取查询条件
parse_qs有几种实现
urlparse.parse_qs 返回字典 urlparse.parse_qsl 返回列表
<强> 2。urlparse。urlsplit 强>
和urlparse差不多,将url分为5部分,返回一个包含5个字符串项目的元组:协议,位置,路径,查询,片段。
import urlparse 时间=url_change urlparse.urlsplit (& # 39; https://i.cnblogs.com/EditPosts.aspx?opt=1& # 39;) print url_change SplitResult(计划=& # 39;https # 39;,, netloc=& # 39; i.cnblogs.com& # 39;,,=& # 39;路径/EditPosts.aspx& # 39;,,查询=& # 39;选择=1 & # 39;,,片段=& # 39;& # 39;)
其中方案是协议,netloc是域名服务器,查询路径相对路径是查询的条件,
<强> 3. urlparse。urljoin 强>
将相对的地址组合成一个url,对于输入没有限制,开头必须是http://,否则将不组合前面。
import urlparse 时间=new_url urlparse.urljoin (& # 39; https://baidu.com/ssss/& # 39; & # 39; 88888 & # 39;) print new_url 输出,https://baidu.com/ssss/88888
如果输入错误信息如,new_url=urlparse.urljoin (& # 39; 122 & # 39; & # 39; 88888 & # 39;),,并不会将两者合并,,输出“88888”
关于怎么在Python中实现URL的解析就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。