久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

網(wǎng)頁爬蟲 - 關(guān)于Python的編碼與解碼問題

瀏覽:156日期:2022-08-07 18:51:14

問題描述

在python2中用urllib模塊去請求淘寶的IP地址查詢接口,返回的是一段json字符串,如下所示:

import urllibdef get_data(ip): url = 'http://ip.taobao.com/service/getIpInfo.php?ip=' + ip data = urllib.urlopen(url).read() return dataif __name__ == '__main__': result = get_data('59.151.5.5') print(result)

返回結(jié)果如下:

{'code':0,'data':{'country':'u4e2du56fd','country_id':'CN','area':'u534eu5317','area_id':'100000','region':'u5317u4eacu5e02','region_id':'110000','city':'u5317u4eacu5e02','city_id':'110100','county':'','county_id':'-1','isp':'u4e16u7eaau4e92u8054','isp_id':'100021','ip':'59.151.5.5'}}

在返回結(jié)果中,中文是以 unicode字符串表示,這樣不方便閱讀,我想讓結(jié)果中中文部分直接用中文表示,就像下面這樣:

'city':'北京','ISP':'中國電信'

如果是python3的話返回又是這樣的:

b’{'code':0,'data':{'country':'u4e2du56fd','country_id':'CN','area':'u534eu5317','area_id':'100000','region':'u5317u4eacu5e02','region_id':'110000','city':'u5317u4eacu5e02','city_id':'110100','county':'','county_id':'-1','isp':'u4e16u7eaau4e92u8054','isp_id':'100021','ip':'59.151.5.5'}}’

請問在 python2和python3中分別該如何轉(zhuǎn)碼呢?

問題解答

回答1:

Python3中有兩個方法可以解決你的問題:

print()函數(shù)

Python3開始編碼定義為UTF-8,所以你懂的,直接打印就行:

>>> print('u5317u4eacu5e02')北京市

利用Unicode數(shù)據(jù)庫

有個自帶的庫unicodedata,可以調(diào)用這個庫中的兩個方法,如下:

>>> import unicodedata as u# 這段字符串是來自你給提供的內(nèi)容>>> s = 'u5317u4eacu5e02'>>> s1 = ’’>>> for i in s:s1 += u.lookup(u.name(i))# 輸出結(jié)果 >>> s1’北京市’

補(bǔ)充一下,如果單獨(dú)處理字符可以用上面的方法,但是剛才回答完才發(fā)現(xiàn)你的返回值為byte對象,Python3中這種對象處理很簡單,修改你的代碼如下:

import urllib.request as rdef get_data(ip): url = 'http://ip.taobao.com/service/getIpInfo.php?ip=' + ip data = r.urlopen(url).read() return dataif __name__ == '__main__': result = get_data('59.151.5.5') print(eval(result))

我測試完的返回值是:

{’data’: {’area_id’: ’100000’, ’isp’: ’世紀(jì)互聯(lián)’, ’country_id’: ’CN’, ’country’: ’中國’, ’region_id’: ’110000’, ’county_id’: ’-1’, ’ip’: ’59.151.5.5’, ’city’: ’北京市’, ’area’: ’華北’, ’county’: ’’, ’city_id’: ’110100’, ’isp_id’: ’100021’, ’region’: ’北京市’}, ’code’: 0}

希望采納

回答2:

Python 3里你可以通過decode方法把bytes轉(zhuǎn)換str:

result = get_data('59.151.5.5').decode(’raw_unicode_escape’)回答3:

這樣就好了==

import jsonprint json.dumps(json.loads(result), ensure_ascii=False)回答4:

請使用py3

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 青浦区| 麻阳| 邵阳市| 平湖市| 获嘉县| 耒阳市| 祁门县| 固阳县| 青河县| 拜泉县| 井冈山市| 茂名市| 印江| 甘洛县| 县级市| 嘉兴市| 安吉县| 洛宁县| 宜昌市| 海宁市| 双鸭山市| 耒阳市| 丰宁| 华亭县| 泉州市| 三江| 襄汾县| 梁平县| 靖州| 南昌县| 河池市| 尉犁县| 宝坻区| 孙吴县| 宿迁市| 庐江县| 农安县| 绥中县| 图片| 镇远县| 南丹县|