文章詳情頁
python - 爬取某網(wǎng)站時(shí)需要瀏覽器刷新一次才能返回真實(shí)的頁面數(shù)據(jù)?
瀏覽:116日期:2022-08-10 17:31:34
問題描述
請(qǐng)求所需參數(shù)全部帶上了,并且已帶上cookies,已修改header,拿到的數(shù)據(jù)是提示刷新的HTML,如圖:原網(wǎng)頁是動(dòng)態(tài)加載的瀑布流,即往不斷下拉就不斷有內(nèi)容呈現(xiàn)出來,靜候大神,目前采用scrapy框架,暫時(shí)還不想上selenium+phantomjs,太重了
問題解答
回答1:動(dòng)態(tài)加載的數(shù)據(jù)你應(yīng)該找ajax api請(qǐng)求,而不是在網(wǎng)頁找,工欲善其事必先利其器,善用 F12。
回答2:這種情況比抓取一個(gè)代理ip網(wǎng)頁,使用cookie但是報(bào)錯(cuò)好解決多了==,你完全可以判斷當(dāng)前頁面內(nèi)容然后進(jìn)行模擬刷新~ 重要的是保持會(huì)話。
如果還不行的話,可以加referer再試一試
相關(guān)文章:
1. 為什么我ping不通我的docker容器呢???2. 關(guān)于docker下的nginx壓力測(cè)試3. javascript - vue vue-router 報(bào)$router重復(fù)定義4. java - 根據(jù)月份查詢多個(gè)表里的內(nèi)容怎么實(shí)現(xiàn)好?5. javascript - webpack熱加載配置不生效6. 關(guān)于Java引用傳遞的一個(gè)困惑?7. debian - docker依賴的aufs-tools源碼哪里可以找到啊?8. windows2003下的apache響應(yīng)時(shí)間特別長(zhǎng)?9. angular.js - angular內(nèi)容過長(zhǎng)展開收起效果10. node.js - node exec 執(zhí)行沒反應(yīng)
排行榜

熱門標(biāo)簽