文章詳情頁

python - pyspider翻頁問題？

瀏覽：142日期：2022-08-18 18:47:48

問題描述

想要爬取愛卡汽車的每個汽車的口碑，但是在翻頁問題總是進不去，無論是用chorme還是自帶的css selector helper抓取到的CSS PATH都無法翻頁，請求幫助，代碼如下

#!/usr/bin/env python# -*- encoding: utf-8 -*-# Created on 2017-03-21 12:57:03# Project: test03import refrom pyspider.libs.base_handler import *class Handler(BaseHandler): crawl_config = { } @every(minutes=24 * 60) def on_start(self):self.crawl(’http://newcar.xcar.com.cn/price/’, callback=self.index_page) @config(age=10 * 24 * 60 * 60) def index_page(self, response):for each in response.doc(’a[href^='http']’).items(): if re.match('http://newcar.xcar.com.cn/d', each.attr.href, re.U): self.crawl(each.attr.href, callback=self.list_page) def list_page(self, response):for each in response.doc(’body > p.demio_wp > p > ul > li:nth-child(6) > a’).items(): self.crawl(each.attr.href, callback=self.list_page1)def list_page1(self, response):for each in response.doc(’.review_gml_tit > .more’).items(): self.crawl(each.attr.href, callback=self.detail_page) #翻頁，問題出在下面這里for each in response.doc(’body > p.review_main > p.review_left > p > p.review_comments > p.review_comments_dl > p.pagers > a:nth-child(2)’).items(): self.crawl(each.attr.href, callback=self.list_page1)@config(priority=2) def detail_page(self, response):return { 'branch':response.doc(’#nav_ps > em > a’).text(), 'text':response.doc(’body > p.review_main > p.review_left > p > p.review_comments > p.review_comments_dl > dl > dd’).text(), }

問題解答

回答1：

評論是 javascript 加載的。

Python 編程

上一條：Python3的CSV模塊怎樣可以把數據存儲到WPS中下一條：算法 - python 給定一個正整數a和一個包含任意個正整數的列表 b，求所有<=a 的加法組合

相關文章：

1. debian - docker依賴的aufs-tools源碼哪里可以找到啊？2. css3 - 這個右下角折角用css怎么畫出來？3. mysql - eclispe無法打開數據庫連接4. windows2003下的apache響應時間特別長?5. javascript - 在 model里定義的引用表模型時，model為undefined。6. 關于Java引用傳遞的一個困惑？7. java - 根據月份查詢多個表里的內容怎么實現好？8. javascript - 一個關于客戶端和前端通信的疑惑？9. php - 一個操作請求多個服務如何保證數據的安全？10. javascript - webpack熱加載配置不生效

排行榜

					
					關于docker下的nginx壓力測試
為什么我ping不通我的docker容器呢？？？
angular.js - angular內容過長展開收起效果
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
javascript - webpack熱加載配置不生效
關于Java引用傳遞的一個困惑？
php - 一個操作請求多個服務如何保證數據的安全？
css3 - 這個右下角折角用css怎么畫出來？
java - 根據月份查詢多個表里的內容怎么實現好？
javascript - 一個關于客戶端和前端通信的疑惑？
windows2003下的apache響應時間特別長?
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - pyspider翻頁問題？