久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

html - Python爬蟲,翻頁數據怎么爬,URL不變

瀏覽:125日期:2022-08-09 14:14:12

問題描述

網址:http://quote.eastmoney.com/ce...我想爬所有頁的名稱數據,(這里只有兩頁),判斷有沒有下一頁的條件該怎么寫呢?代碼:

from selenium import webdriverdriver=webdriver.PhantomJS()url=’http://quote.eastmoney.com/center/list.html#28003684_0_2’driver.get(url)usoup = BeautifulSoup(driver.page_source, ’xml’)n=[]while True: t=usoup.find(’table’,{’id’:’fixed’}) utable=t.find_all(’a’,{’target’:’_blank’}) for i in range(len(utable)): if i % 6 ==1: n.append(utable[i].text) if #停止條件怎么寫: break driver.find_element_by_xpath(r’//*@id='pagenav']/a[2]’).click() usoup = BeautifulSoup(driver.page_source, ’xml’)

后面這里就不會寫了。。。

問題解答

回答1:

可以判斷每一頁的條目,每一頁共20條,如果當前頁不足20條的時候,說明此頁是最后一頁了,爬完當前頁就該停止了

回答2:

話說 這個表格不是都有個jsonp的返回接口嗎?為什么還要爬?

回答3:

走的就是jsonp接口,直接拿就好了。

非要抓取的話,只能用selenium + phantomjs 之類的模擬頁面去獲取了。

回答4:

http://nufm.dfcfw.com/EM_Fina...{rank:[(x)],pages:(pc)}&token=7bc05d0d4c3c22ef9fca8c2a912d779c&jsName=quote_123&_g=0.5385195357178545

標簽: Python 編程
主站蜘蛛池模板: 大足县| 汶上县| 夏津县| 苏尼特右旗| 南陵县| 霍州市| 咸宁市| 株洲县| 旌德县| 公主岭市| 高雄县| 双牌县| 翁牛特旗| 洛扎县| 威海市| 东乡族自治县| 海门市| 玛曲县| 东乌珠穆沁旗| 石阡县| 柯坪县| 灯塔市| 施秉县| 马公市| 禄劝| 沽源县| 临江市| 论坛| 二连浩特市| 靖江市| 呼和浩特市| 宜城市| 宿松县| 河东区| 石河子市| 西乡县| 桓台县| 成安县| 威海市| 甘孜县| 弋阳县|