小编给大家分享一下解决python打开中文文件名乱码的问题,相信大部分人都还不怎么了解,因此分享这边文章给大家学习,希望大家阅读完这篇文章后大所收获、下面让我们一起去学习方法吧!
Python2默认是不支持中文的,一般我们在程序的开头加上# - *编码:utf - 8 - *——来解决这个问题,但是在我用open()方法打开文件时,中
文名字却显示成了乱码。
我先给大家说python中说的编码问题,python中的字符串的大概分为为str和Unicode两种形式,其中str常用的编码类型为utf - 8
, gb2312, gbk等等,python使用Unicode作为编码的基础类型.str记录的是字节数组,只是某种编码的存储格式,终于输出到文件或是
打印出来是什么格式,完全取决于其解码的编码将他解码成什么样子;Unicode是一种类似于符号集的抽象编码,它只规定了符号的二进
制代码,却没有规定这个二进制代码该如何存储,也就是它只是一种内部表示,不能直接保存,所以存储时需要规定一种存储形式,比如
utf - 8等。
python中有编码转换的函数有:
解码(char_set)实现char_set解码成Unicodeencode (char_set)实现Unicode编码成char_set
查看python文档会发现:
open (filename, & # 39; w # 39;)这个方法中,文件名这个参数必须是Unicode编码的参数。
我之前加上# - *编码:utf - 8 - *——将编码设置为utf - 8,当调用这个方法往里传参数时,需要将这个变量文件名解码成Unicode。
比=& # 39;如文件名中文. txt # 39;,使用open()时,这样写开放(filename.decode (& # 39; utf - 8 # 39;), & # 39; w # 39;),这样创建的中文文件名就没有乱码问题了。
以上是解决python打开中文文件名乱码的问题的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!