问题现象:

  有时当读取一个文件时,报出以下错误,很是捉急。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 7205: invalid continuation byte

问题原因:

文件中含有utf-8或gbk无法编码的字符,或者是打开的编码不对。

解决方法:

解决方法一:用 utf-8 编码打开 (实际文件的编码方式
如下: open('d:/data/synopses_list_wiki.txt',encoding='utf-8')

解决方法二:在open中加入errors=‘ignore’ ,忽略它即可(推荐)

open('test.txt',errors='ignore')

 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐