久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python - 爬蟲(chóng)獲取網(wǎng)站數(shù)據(jù),出現(xiàn)亂碼怎么解決。

瀏覽:123日期:2022-08-04 09:36:09

問(wèn)題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見(jiàn)文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫(xiě)的很簡(jiǎn)單,但是print出來(lái)的是亂碼嘗試了 print str.decode(“utf-8“”)但是報(bào)錯(cuò)UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問(wèn)題解答

回答1:

str = response.read()這句有兩個(gè)問(wèn)題:1、str是內(nèi)置關(guān)鍵字必須更改為其他變量名2、查看網(wǎng)頁(yè)源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應(yīng)解碼

小建議這種小程序?qū)憘€(gè)函數(shù)會(huì)比用類(lèi)來(lái)更加方便,無(wú)論是使用還是實(shí)現(xiàn)

回答2:

推測(cè)用的是sublime text?參考這個(gè)

回答3:

這兒應(yīng)該是encode不是decode,而且你的變量名居然是跟內(nèi)置關(guān)鍵字名字一樣

回答4:

應(yīng)該是encode吧

標(biāo)簽: Python 編程
主站蜘蛛池模板: 镇原县| 黄浦区| 四川省| 高雄市| 玉树县| 达孜县| 轮台县| 揭西县| 海丰县| 宜丰县| 筠连县| 平潭县| 沂水县| 元阳县| 黑山县| 双辽市| 东乡| 昭苏县| 谢通门县| 灵丘县| 康保县| 天峻县| 金溪县| 舞钢市| 调兵山市| 屏山县| 晴隆县| 阿克陶县| 射洪县| 融水| 屯留县| 高碑店市| 沐川县| 荃湾区| 都昌县| 东海县| 怀集县| 唐山市| 洪洞县| 沙田区| 宿松县|