永发信息网

python怎么解码ISO-8859-2格式.并转换为utf-8

答案:2  悬赏:10  手机版
解决时间 2021-04-29 21:11
  • 提问者网友:沦陷
  • 2021-04-29 02:27
python怎么解码ISO-8859-2格式.并转换为utf-8
最佳答案
  • 五星知识达人网友:渡鹤影
  • 2021-04-29 02:43
比如str是ISO-8859-2格式的字符串,
你需要先解码:str = str.decode("ISO-8859-2"),这样返回的就是unicode的str,
然后再使用个utf8编码:str = str.encode("utf-8"),这样就是utf8的了。

也就是str=str.decode("ISO-8859-2").encode("utf-8")

如果解决了您的问题请采纳!
如果未解决请继续追问!
全部回答
  • 1楼网友:毛毛
  • 2021-04-29 03:45
如果是解决html编码问题,可能是因为html中混入了非法字符,导致chardet.detect(data)辨认错误
直接decode('gbk','ignore').encode('utf-8')应该就可以解决
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯