无论是Python2还是Python3,都使用unicode作为内存编码,简称内码。保存在python解释器内存中的文本,输出到屏幕,编辑器,或者保存成文件的时候,都要将内码转换成utf8或者gbk等编码格式;同样,python解释器从输入设备接收文本,或者从文件读取文本的时候,都要将utf8或者gbk等编码转换成unicode编码格式,因此,无论是Python2还是Python3,想要在unicode, use utf8, gbk等编码格式之间转换的话,下图是通用的:
Python:一图看懂Python2还是Python3的编码