我们使用python中,遇到爬取网站情况,用到unicode编码,我们需要将它转换为中文,unicode编码转换为中文的方法有四种:使用unicode_escape 解码、使用encode()方法转换,再调用bytes.decode()转换为字符串形式、 使用json.loads 解码(为json 格式)、使用eval(遇到Unicode是通过requests在网上爬取的时候)。具体内容请看本文。
方法一:使用unicode_escape 解码
unicode = b'\\u4f60\\u597d' re = unicode.decode("unicode_escape") print(re) 返回:你好
方法二:使用encode()方法转换,再调用bytes.decode()转换为字符串形式
s = r'\u4f60\u597d' print(s.encode().decode("unicode_escape"))
方法三: 使用json.loads 解码(为json 格式)
str = '\u4eac\u4e1c\u653e\u517b\u7684\u722c\u866b' print json.loads('"%s"' %str)
方法四:使用eval(遇到Unicode是通过requests在网上爬取的时候)
response = requests.get(url,headers=headers) re = eval("u"+"\'"+response.text+"\'") print(re)
以上就是小编整理的python中将unicode编码转换为中文的方法,希望能对你有所帮助哟~
文章名称:创新互联Python教程:python中unicode编码转换为中文
分享URL:http://www.shufengxianlan.com/qtweb/news44/381444.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联