文章詳情頁

python - scrapy爬蟲不能循環運行？

瀏覽：111日期：2022-07-28 11:08:58

問題描述

scrapy只能爬取一個頁面上的鏈接，不能持續運行爬完全站，以下是代碼，初學求指導。

class DbbookSpider(scrapy.Spider): name = 'imufe' allowed_domains = [’http://www.imufe.edu.cn/’] start_urls=(’http://www.imufe.edu.cn/main/dtxw/201704/t20170414_127035.html’) def parse(self, response):item = DoubanbookItem()selector = scrapy.Selector(response)print(selector)books = selector.xpath(’//a/@href’).extract()link=[]for each in books: each=urljoin(response.url,each) link.append(each)for each in link: item[’link’] = each yield itemi = random.randint(0,len(link)-1)nextPage = link[i]yield scrapy.http.Request(nextPage,callback=self.parse)

問題解答

回答1：

是不是爬得太快讓封了

Python 編程

上一條：mysql - Python創建相同結構的多個數據庫表，表名是循環添加的。下一條：module - python模塊from import語句相對導入，加不加點號有什么區別？

相關文章：

1. javascript - 在 model里定義的引用表模型時，model為undefined。2. python3.x - c++調用python33. css3 - 沒明白盒子的height隨width的變化這段css是怎樣實現的?4. atom開始輸入！然后按tab只有空格出現沒有html格式出現5. css3 - 這個右下角折角用css怎么畫出來？6. javascript - 一個關于客戶端和前端通信的疑惑？7. javascript - webpack熱加載配置不生效8. debian - docker依賴的aufs-tools源碼哪里可以找到?。?/a>9. java - 根據月份查詢多個表里的內容怎么實現好？10. android - 課程表點擊后浮動后邊透明可以左右滑動的界面是什么？

排行榜

					
					關于docker下的nginx壓力測試
為什么我ping不通我的docker容器呢？？？
angular.js - angular內容過長展開收起效果
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
javascript - webpack熱加載配置不生效
android - 課程表點擊后浮動后邊透明可以左右滑動的界面是什么？
css3 - 沒明白盒子的height隨width的變化這段css是怎樣實現的?
python3.x - c++調用python3
css3 - 這個右下角折角用css怎么畫出來？
java - 根據月份查詢多個表里的內容怎么實現好？
javascript - 一個關于客戶端和前端通信的疑惑？
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - scrapy爬蟲不能循環運行？

python - scrapy爬蟲不能循環運行？