python 设置默认编码_python 默认编码的理解与设置

原链接：python 里面的编码和解码，就是unicode 和str 这两种形式的相对转换。编码：　unicode→→→ str解码：str→→→ unicode有两个设置编码的知识点１、文件开头的：# -*- coding=utf8 -*-python的默认脚本文件都是以utf８编码的，当文件中有非utf８编码范围内的字符的时候就要使用“编码提示”来修正。２、sys.setdefaulte...

weixin_39947314

631人浏览 · 2020-12-03 22:28:22

weixin_39947314 · 2020-12-03 22:28:22 发布

原链接：

python 里面的编码和解码，就是unicode 和str 这两种形式的相对转换。

编码：　unicode→→→ str

解码：str→→→ unicode

有两个设置编码的知识点

１、文件开头的：# -*- coding=utf8 -*-

python的默认脚本文件都是以utf８编码的，当文件中有非utf８编码范围内的字符的时候就要使用“编码提示”来修正。

２、sys.setdefaultencoding('utf-8')

先说下如何使用：

>>> import sys>>> reload(sys)

>>> sys.setdefaultencoding('utf8')

>>>

reload(sys)　这一句是必须的，当脚本加载完毕之后，会把setdefaultencoding这个方法给删掉，我们需要reload(sys)　才可以使用。

用实例来理解它的作用：

>>> import sys

>>> sys.getdefaultencoding()

'ascii'

>>> str = "中文"

>>> print str

中文

>>> str.encode('utf8')

Traceback (most recent call last):

File "", line 1, in

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

无法将str编码为utf８。

编码：　unicode→→→ str

解码：str→→→ unicode

>>> str.encode('utf8')　这一句在执行的时候，会先将str解码为ascii(也就是sys.setdefaultcoding()所设置的值，默认是ascii)，再编码为utf８。

ascii并不是unicode的编码形式之一。所以无法进行这种类型的转换。

转换过程如下：

str --------> unicode --------------> str(utf8)

unicode这里就是指setdefaultcoding()所设的值。

再进行实验：

>>> import sys

>>> reload(sys)

>>> sys.setdefaultencoding('utf8')

>>> str.encode('utf8')

'\xe4\xb8\xad\xe6\x96\x87'

>>> print str

中文

>>>

这样子就可以了，转换流程变为如下：

str ---------> unicode(utf8) -----------> str(utf8)

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

新知实验室 TRTC在线上教育场景中的一种应用实践

腾讯云开发者社区

基于腾讯云实时音视频（TRTC）的web端多人人脸识别小游戏

腾讯云开发者社区

【新知实验室】腾讯云TRTC接入测试以及状态同步功能重点验证

由于文章内容涉及公司业务，关于具体业务部分均使用代称，请知悉。某学习机，是一款主打学生自主学习的教育产品。老师上传课件、视频资料、练习题等，作为一个独立完整的学习单元。学员首先自主学习，学习结束之后进行测评，通过测评，则进入下一个学习环节，类似游戏中的通关模式。如果不能通过评测或者在学习过程中存在疑问，可以向班主任老师提问，老师可以通过IM消息、语音连麦方式给学习答疑。答疑时间基本都在5~10分钟