Python 2.7中文显示与处理方法

  

在学习使用Python的过程中,一定会遇到文字输入与处理,这就不可避免的会使用中文字符。但是Python2.7默认使用的字符集是ASCII,并不支持中文字符的显示与处理,因些如果要在Python中处理中文就需要进行一些额外的处理。

  

        #/usr/bin/env python   # - * -编码:utf - 8 - * -      

但这样做,只是让你的程序在运行的过程中显示中文,如果你要将中文字符存储在文件中,或者写入到数据库中,这样的设置是不能满足你的需要。

  

        导入系统   重载(系统)   sys.setdefaultencoding (utf - 8)      

也许是Python的虫子在导入系统后必须再一次重新加载(系统)、下面去设置默认字符编码的语句才能生效。

  

  

经常会遇到的是,进行了第一步和第二步设置后,还是无法正常显示和处理中文字符,这时也只能随用随编码了。

  

假设待处理字符串为字符串

  

使用下面的语句进行utf - 8编码:

        string.encode (utf - 8)      

使用下面的语句进行utf - 8解码:

        unicode(字符串,编码=皍tf - 8”)      

如果为了方便可以将上面二个语句写成方法随时调用:

        def encode_utf8(字符串):   返回string.encode (“utf - 8”)      def decode_utf8(字符串)   返回unicode(字符串编码=皍tf - 8”)   之前      

以上这篇Python 2.7中文显示与处理方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

Python 2.7中文显示与处理方法