文章詳情頁

python - 爬取某網(wǎng)站時(shí)需要瀏覽器刷新一次才能返回真實(shí)的頁面數(shù)據(jù)？

瀏覽：116日期：2022-08-10 17:31:34

問題描述

請(qǐng)求所需參數(shù)全部帶上了，并且已帶上cookies,已修改header，拿到的數(shù)據(jù)是提示刷新的HTML，如圖： python - 爬取某網(wǎng)站時(shí)需要瀏覽器刷新一次才能返回真實(shí)的頁面數(shù)據(jù)？原網(wǎng)頁是動(dòng)態(tài)加載的瀑布流，即往不斷下拉就不斷有內(nèi)容呈現(xiàn)出來，靜候大神，目前采用scrapy框架，暫時(shí)還不想上selenium+phantomjs，太重了

問題解答

回答1：

動(dòng)態(tài)加載的數(shù)據(jù)你應(yīng)該找ajax api請(qǐng)求，而不是在網(wǎng)頁找，工欲善其事必先利其器，善用 F12。

回答2：

這種情況比抓取一個(gè)代理ip網(wǎng)頁，使用cookie但是報(bào)錯(cuò)好解決多了＝＝，你完全可以判斷當(dāng)前頁面內(nèi)容然后進(jìn)行模擬刷新～重要的是保持會(huì)話。

如果還不行的話，可以加referer再試一試

Python 編程

上一條：flask - python 多維字典遍歷下一條：python - 關(guān)于基于tornado的websocket服務(wù)在本機(jī)上調(diào)試的問題

相關(guān)文章：

1. 為什么我ping不通我的docker容器呢？？？2. 關(guān)于docker下的nginx壓力測(cè)試3. javascript - vue vue-router 報(bào)$router重復(fù)定義4. java - 根據(jù)月份查詢多個(gè)表里的內(nèi)容怎么實(shí)現(xiàn)好？5. javascript - webpack熱加載配置不生效6. 關(guān)于Java引用傳遞的一個(gè)困惑？7. debian - docker依賴的aufs-tools源碼哪里可以找到啊？8. windows2003下的apache響應(yīng)時(shí)間特別長(zhǎng)?9. angular.js - angular內(nèi)容過長(zhǎng)展開收起效果10. node.js - node exec 執(zhí)行沒反應(yīng)

排行榜

					
					關(guān)于docker下的nginx壓力測(cè)試
為什么我ping不通我的docker容器呢？？？
angular.js - angular內(nèi)容過長(zhǎng)展開收起效果
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
javascript - webpack熱加載配置不生效
關(guān)于Java引用傳遞的一個(gè)困惑？
java - 根據(jù)月份查詢多個(gè)表里的內(nèi)容怎么實(shí)現(xiàn)好？
node.js - node exec 執(zhí)行沒反應(yīng)
windows2003下的apache響應(yīng)時(shí)間特別長(zhǎng)?
javascript - vue vue-router 報(bào)$router重復(fù)定義
dockerfile - [docker build image失敗- npm install]
				

熱門標(biāo)簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - 爬取某網(wǎng)站時(shí)需要瀏覽器刷新一次才能返回真實(shí)的頁面數(shù)據(jù)？