编码总结
目录爬虫编码总结原因解决方案非正规解决方案python上的一些总结中文用 unicode 表示总结编码与解码decode解码encode编码raw_input相等陷阱小记编码错误问题Illegal Multibyte SequenceInvalid Start Byte总结 爬虫编码总结 原因 取到的网页文字内容在编码上存在一定的 trick ,简单来说就是 unicode 形式的 gbk 编码内容,形如: u'\xd6\xb0\xce\xbb\xc3\xe8\xca\xf6' 而事实上,这个字符串实际所要表达的 gbk 编码内容为 ‘\xd6\xb0\xce\xbb\xc3\xe8\xc
用户评论