久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

python - scrapy 處理 文章 分頁的內容

瀏覽:116日期:2022-08-03 16:15:10

問題描述

如一篇文章有2-3頁,然后想把這些內容頁爬下來,拼接成一頁,然后再放入數據庫。文章url如:article_1.html,article_2.htmlitem有:item[’title’],item[’content’]而item[’content’]就是拼接成一頁的內容。大概怎么寫呢?

問題解答

回答1:

找到分頁接口url

回答2:

找到那個下一頁的鏈接,加入到爬取url列表中

回答3:

可以在rules里面寫正則自動掃描符合的url

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 永新县| 嘉定区| 长沙市| 南川市| 连江县| 阳朔县| 茶陵县| 保德县| 乐平市| 息烽县| 高要市| 长春市| 田阳县| 鹰潭市| 额济纳旗| 德江县| 四川省| 旺苍县| 台湾省| 临高县| 定陶县| 封丘县| 洛阳市| 城口县| 穆棱市| 安龙县| 公安县| 方山县| 嘉峪关市| 荣昌县| 淮南市| 内江市| 通州区| 九寨沟县| 德惠市| 容城县| 兴山县| 依兰县| 无为县| 出国| 勐海县|