久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

網(wǎng)頁爬蟲 - python爬蟲翻頁問題,請問各位大神我這段代碼怎樣翻頁,還有價(jià)格要登陸后才能看到,應(yīng)該怎么解決

瀏覽:247日期:2022-08-06 14:43:40

問題描述

import urllib.requestimport reweb=urllib.request.urlopen(’https://www.gpyh.com/pricebuy/index?pageNum=1&hasStock=&goodsStandardId=1931&materialDictCode=&materialGroupCode=037001&diameter=&length=&brandId=&merchantId=’)neirong=web.read()def getPage(self,pageIndex): url = self.siteURL + '?pageNum=' + str(pageIndex) request = urllib2.Request(url) response = urllib2.urlopen(request) return response.read().decode(’gbk’)jiangrenhua=neirong.decode(’UTF-8’)RegularExpression=’<td>(.*)</td>’Valuable=re.findall(RegularExpression,jiangrenhua)information=[]for i in range(173): print(Valuable[i]

問題解答

回答1:

?pageNum=' + str(pageIndex)

這一個(gè)不就是你的頁碼控制嗎?登錄后才看到那就用cookie或者用戶名密碼模擬登錄后獲取

回答2:

httplib2基本應(yīng)該是所有http請求的終結(jié)者了吧。

import httplib2import urllibhttp = httplib2.Http()url=’要獲取的地址’header={’Accept’:’text/html’, ’Accept-Encoding’:’gzip, deflate, sdch’, ’Accept-Language’:’zh-CN,zh;q=0.8’, ’Cache-Control’:’max-age=0’, ’Connection’:’keep-alive’, ’Cookie’:’cookie內(nèi)容’, ’Upgrade-Insecure-Requests’:’1’, ’User-Agent’:’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’} #要有登陸狀態(tài)才能翻頁就要模擬登陸后把cookie放進(jìn)去body_value={’username’:’test’,’password’:’123456’} #表單的所有內(nèi)容body_value=urllib.urlencode(body_value) #utf8編碼response, content = http.request(url, ’GET’, headers=header,body=body_value) #GET或者POST方法response.encoding = ’utf-8’#content就是返回內(nèi)容

標(biāo)簽: Python 編程
主站蜘蛛池模板: 大姚县| 大同县| 井研县| 山西省| 西乌| 双江| 托里县| 株洲市| 凌源市| 郓城县| 清水县| 河南省| 巨野县| 介休市| 彝良县| 咸丰县| 郁南县| 梧州市| 唐海县| 四平市| 岱山县| 连平县| 高邑县| 延吉市| 那曲县| 镇江市| 洞头县| 淮北市| 封丘县| 乐昌市| 丹江口市| 宁陵县| 舟山市| 临夏市| 通江县| 马鞍山市| 云龙县| 苏尼特右旗| 霞浦县| 同心县| 淮滨县|