久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

python - Scrapy如何得到原始的start_url

瀏覽:161日期:2022-06-27 15:45:21

問題描述

Scrapy爬蟲時,由于重定向或是其他原因,會導致原始的start_url發生改變,怎樣才能得到原始的start_url?

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse) def parse(self, response): item = YourItem() item[’start_url’] = 原始請求的start_url yield item

問題解答

回答1:

參考文章:Scrapy爬蟲常見問題總結

利用Request中的meta參數傳遞信息

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse, meta={’start_url’:start_url}) def parse(self, response): item = YourItem() item[’start_url’] = response.meta[’start_url’] yield item

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 金沙县| 梨树县| 浮山县| 峨眉山市| 邵阳市| 怀来县| 台东市| 利津县| 大理市| 宜黄县| 宜州市| 马鞍山市| 马山县| 崇仁县| 仪征市| 金湖县| 封丘县| 原阳县| 前郭尔| 镇雄县| 义乌市| 五寨县| 海原县| 宁陕县| 淅川县| 新巴尔虎右旗| 大足县| 梧州市| 屯门区| 云南省| 咸丰县| 德令哈市| 富宁县| 浦东新区| 巴青县| 革吉县| 留坝县| 孟村| 商丘市| 密山市| 谢通门县|