URL的组成部分
方案:方案名或者协议名,比如http、https、ftp等
主持人:主机名,可以是IP,或者域名
端口:端口号,有时候可以省略,浏览器等客户端会依据计划使用默认的端口号,例如http的默认端口号是80,https的默认端口号是443 .
路径:标记资源所在的位置,默认是/,以“/笨?br/>
查询:键值的形式,比如https://search.jd.com/Search?keyword=openresty&,以便=utf-8& qrst=1
另外:
#片段”:URI所定位的资源内部的一个“锚点”或者说的是“标签”,浏览器可以在获取资源后直接跳转到它指示的位置。
URI的编码问题:
在URI里只能使用ASCII码
URI引入了编码机制,对于ASCII码以外的字符集和特殊字符做一个特殊的操作,把它们转换成与URI语义不冲突的形式,俗称“转义”。
比如:空格被转义成“% 20”、“吗?“被转义成“% 3 f”