介绍
小编给大家分享一下解决python3里打印的中文乱码问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!
Python是个好工具,但是也有其固有的一些缺点。最近在学习网页爬虫时就遇到了这样一种问题,中文网站爬取下来的内容往往中文显示乱码。
首先,我说一下Python中文乱码的原因,Python中文乱码是由于Python在解析网页时默认用Unicode去解析,而大多数网站是utf - 8格式的,并且解析出来之后,Python竟然再以Unicode字符格式输出,会与系统编码格式不同,导致中文输出乱码,知道原因后我们就好解决了。下面上代码,实验对象仍是被人上了无数遍的百度主页~
#,- *安康;编码:utf-8 - * - , import urllib2 import 再保险 import 请求 import 系统 , import urllib #设置编码 重载(系统) sys.setdefaultencoding (& # 39; utf - 8 # 39;) #获得系统编码格式 时间=type sys.getfilesystemencoding () 时间=r urllib.urlopen (“http://www.baidu.com") #将网页以utf - 8格式解析然后转换为系统默认格式 时间=a r.read () .decode (& # 39; utf - 8 # 39;) .encode(类型) print
python学习网,免费的python学习网站,欢迎在线学习!
最后输出效果,中文完美输出
以上是解决python3里打印的中文乱码问题的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!