如何在Python中使用字符串与编码

  介绍

本篇文章为大家展示了如何在Python中使用字符串与编码,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

Python的五大特点是什么

Python的五大特点:1。简单易学,开发程序时,专注的是解决问题,而不是搞明白语言本身。2。面向对象,与其他主要的语言如c++和Java相比,Python以一种非常强大又简单的方式实现面向对象编程。3。可移植性,Python程序无需修改就可以在各种平台上运行。4。解释性,Python语言写的程序不需要编译成二进制代码,可以直接从源代码运行程序。5。开源,Python是牙线(自由/开放源码软件)之一。

<强>编码和解码

,字符串在内存中以Unicode表示,在操作字符串时,经常需要str和字节互相转换
,如果在网络上传输或保存到磁盘上,则从内存读到的数据就是str,要把str变为以字节为单位的字节,称为编码
,如果从网络或磁盘上读取字节流,则从网络或磁盘上读到的数据就是字节,要把字节变为str,称为解码
,为避免乱码问题,应当始终坚持使用utf - 8编码对str和字节进行转换

<强>使用示例:

<强>单个字符的编码

打印(奥德(& # 39;一个# 39;)),#输出:65年获取字符的整数表示   打印(科(66)),#输出:B,把编码转换为对应的字符

<强>十六进制表示

打印(& # 39;中文& # 39;),#输出:& # 39;中文& # 39;,   打印(& # 39;\ u4e2d \ u6587& # 39;), #输出:& # 39;中文& # 39;,& # 39;\ u4e2d \ u6587& # 39;和& # 39;中文& # 39;完全对等,如果知道字符的整数编码,还可以用十六进制这么写str

<强>字节类型的数据表示

x=b # 39; abc # 39;# Python类对字节型的数据用带b前缀的单引号或双引号表示,& # 39;abc # 39;和b # 39; abc # 39;在显示上完全一样,但字节的每个字符都只占用一个字节

<强>编码

打印(& # 39;abc # 39; .encode (& # 39; ascii # 39;)), #输出:b # 39; abc # 39;,以Unicode表示的str通过编码()方法可以编码为指定的字节   打印(,& # 39;中文& # 39;.encode (& # 39; utf - 8 # 39;)), #输出:b # 39; \ xe4 \ xb8 \ xad \ xe6 \ x96 \ x87 # 39;,   打印(,& # 39;中文& # 39;.encode (& # 39; ascii # 39;)), #输出:报错,因为中文字符在ascii编码范围外,所以导致编码失败

<强>解码

打印(b # 39; abc # 39; .decode (& # 39; ascii # 39;)), #输出:& # 39;abc # 39;   print (b # 39; \ xe4 \ xb8 \ xad \ xe6 \ x96 \ x87 # 39; .decode (& # 39; ascii # 39;)), #输出:& # 39;中文& # 39;   打印(b # 39; \ xe4 \ xb8 \ xad \ xff # 39; .decode (& # 39; utf - 8 # 39;,,错误=& # 39;忽略# 39;)),#输出:& # 39;中& # 39;如果字节中只有一小部分无效的字节,可以传入错误=& # 39;忽略# 39;忽略错误的字节

<强>计算长度

# len (a)函数返回一个的长度,如果一个是字符串则返回字符数,如果一个是字节表示则返回字节数   打印(len(& # 39;中文& # 39;)),#输出:2,共2个字符   打印(len (& # 39; abc # 39;)), #输出:3,共3个字符   打印(len (b # 39; abc # 39;)), #输出:3,共是3个字节   打印(len (b # 39; \ xe4 \ xb8 \ xad \ xe6 \ x96 \ x87 # 39;)), #输出:6,共是六个字节   print (len(& # 39;中文& # 39;.encode (& # 39; utf - 8 # 39;))), #输出:6日,1个中文字符经过utf - 8编码后通常会占用3个字节,因此两个汉字的字节数是6

<强>源码文件开头与编码

# !/usr/bin/env  python3 ,,,告诉Linux/OS  X系统,这是一个Python可执行程序,Windows系统会忽略这个注释   #,- *安康;编码:,utf-8  - *安康;,,告诉Python解释器,按照utf - 8编码读取源代码,否则在源代码中写的中文输出可能会有乱码

上述内容就是如何在Python中使用字符串与编码,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。

如何在Python中使用字符串与编码