2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > python codecs.open_Python: open和codecs.open

python codecs.open_Python: open和codecs.open

时间:2021-11-29 08:00:18

相关推荐

python codecs.open_Python: open和codecs.open

python的编解码:

input文件(gbk, utf-8...) ----decode-----> unicode-------encode------> output文件(gbk, utf-8...)

很多文件处理的包是unicode编码,刚开始读入文件(gbk, utf-8...)后要decode为unicode编码格式,再encode为需要

的格式(gbk, utf-8...)。

第一种 用open():

f=open('xxx', 'r')

content=f.read().decode('utf-8')

第二种 用codecs.open():

f=codecs.open(XXX,'r', encoding='utf-8') #使用codecs.open读入时直接解码

content=f.read()

-------12-23--------------------------------------

问题:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

原因可能是文本里有奇怪的符号比如:®,?(英文的问号)( 在学习机器学习实战ham/23.txt这本书时,遇到®符号问题)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。