文章詳情頁

python - scrapy 再次請求的問題

瀏覽：137日期：2022-08-17 18:54:48

問題描述

如：item[’url’]=response.xpath(’a/@href’)分析出一個鏈接，然后想從這個鏈接里的網頁再獲取一些元素，放入item[’other’]。應該怎么寫，謝謝。

問題解答

回答1：

def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True，callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item

最后附上官方文檔https://doc.scrapy.org/en/lat...中文翻譯版http://scrapy-chs.readthedocs...

Python 編程

上一條：python - django模板 include模板的數據問題下一條：Pycharm中文輸出亂碼怎么辦？win10，Pycharm3.2,Python3.5

相關文章：

1. 點擊頁面就自動輸入到mysql.求解2. java - IDEA從SVN檢出項目并在tomcat上運行求詳細流程3. javascript - windos下第一次用Django無法正確創建工程目錄4. java - 多叉樹求值，程序高手，算法高手看過來5. node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？6. node.js - nodejs使用formidable上傳文件問題7. Laravel中文件上傳的問題8. 單擊登錄按鈕無反應9. 誰能告訴我php7+tp5.1時遇到使用session::set()問題10. 靜態資源文件引入無效

排行榜

					
					點擊頁面就自動輸入到mysql.求解
java - 多叉樹求值，程序高手，算法高手看過來
javascript - windos下第一次用Django無法正確創建工程目錄
node.js - nodejs使用formidable上傳文件問題
node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？
java - IDEA從SVN檢出項目 并在tomcat上運行  求詳細流程
javascript - 在ie下為什么會出現這種情況呢 《 無法獲取未定義或 null 引用的屬性“length”》 ？請大神指教。
apache錯誤日志報錯，無法正常訪問網站
form表單中的label標簽
Hibernate Validator異常“找不到類型為java.lang.String的驗證器”
mysql - navicat 經常打開表一直在載入中 也不能關閉 著急解決
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - scrapy 再次請求的問題