文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽：75日期：2022-08-04 16:42:25

問題描述

因為在爬取的網站需要賬號登陸，不方便公開。因此我只能這樣大致性的咨詢，實在抱歉。

我需要爬一個目標網站的數據，發現在點擊下一頁時候，網址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺，捕獲到點擊下一頁時候，向指定地址發送了一條帶多個參數的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取，一個頁面大概5S左右就能獲取，實際用瀏覽器打開也是這個速度。為了爬取大量的數據，準備改用多線程+直接requests.get目標地址的方式來采集，但是發現采集速度非常的慢，從5S降到的20s左右。

請教下，出現這樣現象的原因可能是什么？我該如何解決？請指教

問題解答

回答1：

抱歉浪費了各位的時間- -是我開始測試的時候，周圍有人再下迅雷，網絡炸了。抱歉抱歉

Python 編程

上一條：python - 使用pandas的resample報錯下一條：python - 相當于分組數據的合并，兩個列表生成dataframe，但長度不同

相關文章：

1. 關于docker下的nginx壓力測試2. javascript - webpack熱加載配置不生效3. debian - docker依賴的aufs-tools源碼哪里可以找到啊？4. 為什么我ping不通我的docker容器呢？？？5. angular.js - angular內容過長展開收起效果6. php - 一個操作請求多個服務如何保證數據的安全？7. javascript - js代碼獲取驗證碼倒計時問題8. 主從備份 - 跪求mysql 高可用主從方案9. docker start -a dockername 老是卡住，什么情況？10. dockerfile - [docker build image失敗- npm install]

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。