怎么在Python中实现URL的解析

  介绍

这篇文章运用简单易懂的例子给大家介绍怎么在Python中实现URL的解析,代码非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

在Python中的urlparse模块主要是用于解析URL中的参数,对url按照一定格式进行拆分或拼接,

怎么在Python中实现url的解析

<强> 1. urlparse。urlparse

将url分为6个部分,返回一个包含6个字符串项目的元组:协议,位置,路径,参数,查询,片段。

import  urlparse   时间=url_change  urlparse.urlparse (& # 39; https://i.cnblogs.com/EditPosts.aspx?opt=1& # 39;)   print  url_change

输出结果为:

ParseResult(计划=& # 39;https # 39;,, netloc=& # 39; i.cnblogs.com& # 39;,,=& # 39;路径/EditPosts.aspx& # 39;,, params=& # 39; & # 39;,,查询=& # 39;选择=1 & # 39;,,片段=& # 39;& # 39;)

其中方案是协议,netloc是域名服务器,路径相对路径,参数是参数、查询是查询的条件

urlparse.parse_qs (urlparse.urlparse (url) .query)

这个是获取urlparse分割后元祖中的某一项,urlparse.urlparse (url) .query ,获取查询条件

parse_qs有几种实现

urlparse.parse_qs 返回字典   urlparse.parse_qsl 返回列表

<强> 2。urlparse。urlsplit

和urlparse差不多,将url分为5部分,返回一个包含5个字符串项目的元组:协议,位置,路径,查询,片段。

import  urlparse   时间=url_change  urlparse.urlsplit (& # 39; https://i.cnblogs.com/EditPosts.aspx?opt=1& # 39;)   print  url_change   SplitResult(计划=& # 39;https # 39;,, netloc=& # 39; i.cnblogs.com& # 39;,,=& # 39;路径/EditPosts.aspx& # 39;,,查询=& # 39;选择=1 & # 39;,,片段=& # 39;& # 39;)

其中方案是协议,netloc是域名服务器,查询路径相对路径是查询的条件,

<强> 3. urlparse。urljoin

将相对的地址组合成一个url,对于输入没有限制,开头必须是http://,否则将不组合前面。

import  urlparse   时间=new_url  urlparse.urljoin (& # 39; https://baidu.com/ssss/& # 39; & # 39; 88888 & # 39;)   print  new_url   输出,https://baidu.com/ssss/88888

如果输入错误信息如,new_url=urlparse.urljoin (& # 39; 122 & # 39; & # 39; 88888 & # 39;),,并不会将两者合并,,输出“88888”

关于怎么在Python中实现URL的解析就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。

怎么在Python中实现URL的解析