当前位置:网站首页 > 编程语言 > 正文

字符转编码(字符转换编码)



前言:

我们知道,最早的字符串编码是 ASCII 编码,它仅仅对 10 个数字、26 个大小写英文字母以及一些特殊字符进行了编码。ASCII 码做多只能表示 256 个符号,每个字符只需要占用 1 个字节。

Python 3.x 默认采用 UTF-8 编码格式,有效地解决了中文乱码的问题

方法为字符串类型()提供的方法,用于将 str 类型转换成 bytes 类型,这个过程也称为“编码”。

encode() 方法的语法格式如下:

注意:格式中用 [] 括起来的参数为可选参数,也就是说,在使用此方法时,可以使用 [] 中的参数,也可以不使用。

该方法各个参数的含义如表 1 所示。

表 1 encode()参数及含义:

参数 含义 str 表示要进行转换的字符串。 encoding = "utf-8" 指定进行编码时采用的字符编码,该选项默认采用 utf-8 编码。例如,如果想使用简体中文,可以设置 gb2312。

当方法中只使用这 一个参数时,可以省略前边的“encoding=”,直接写编码格式,例如 str.encode("UTF-8")。 errors = "strict" 指定错误处理方式,其可 选择值可以是:
  • strict:遇到非法字符就抛出异常。
  • ignore:忽略非法字符。
  • replace:用“?”替换非法字符。
  • xmlcharrefreplace:使用 xml 的字符引用。
该参数的默认值为 strict。

注意:使用 encode() 方法对原字符串进行编码,不会直接修改原字符串,如果想修改原字符串,需要重新赋值。

【例 1】将 str 类型字符串“C语言中文网”转换成 bytes 类型。

此方式默认采用 UTF-8 编码,也可以手动指定其它编码格式,例如:

和 方法正好相反,方法用于将 类型的二进制数据转换为 str 类型,这个过程也称为“解码”。

decode() 方法的语法格式如下:

该方法中各参数的含义如表 2 所示。

表 2 decode()参数及含义:

参数 含义 bytes 表示要进行转换的二进制数据。 encoding="utf-8" 指定解码时采用的字符编码,默认采用 utf-8 格式。当方法中只使用这一个参数时,可以省略“encoding=”,直接写编码方式即可。

注意,对 bytes 类型数据解码,要选择和当初编码时一样的格式。 errors = "strict" 指定错误处理方式,其可选择值可以是:
  • strict:遇到非法字符就抛出异常。
  • ignore:忽略非法字符。
  • replace:用“?”替换非法字符。
  • xmlcharrefreplace:使用 xml 的字符引用。
该参数的默认值为 strict。

【例 2】

注意:如果编码时采用的不是默认的 UTF-8 编码,则解码时要选择和编码时一样的格式,否则会抛出异常,例如:

到此这篇关于Python字符串编码转换 和方法详细说明的文章就介绍到这了,更多相关Python encode()和decode()方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

到此这篇字符转编码(字符转换编码)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • pdf文件截图怎么截图(pdf文件截图怎么截图不了)2025-04-13 13:00:07
  • keil破解到2032年(keil破解到2030年)2025-04-13 13:00:07
  • 域名 查ip(域名查ip域名解析)2025-04-13 13:00:07
  • 字符串转xml对象(字符串转xml对象是什么)2025-04-13 13:00:07
  • mt103报文72(MT103报文72项IMAD)2025-04-13 13:00:07
  • 电子税务局打印控件怎么安装(电子税务局打印控件安装后还是打印不了)2025-04-13 13:00:07
  • linux yum命令详解(linux常用命令 yum)2025-04-13 13:00:07
  • vs怎么运行网页(vs2019怎么打开网站)2025-04-13 13:00:07
  • gjk算法复杂度(算法复杂度分析方法)2025-04-13 13:00:07
  • 最全越狱源(最全的越狱源)2025-04-13 13:00:07
  • 全屏图片