久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:148日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 吴旗县| 济南市| 葵青区| 当雄县| 宝山区| 岳阳县| 女性| 云南省| 诸城市| 光山县| 休宁县| 珲春市| 吉安县| 延吉市| 定兴县| 尼木县| 杨浦区| 海原县| 荣成市| 平利县| 陕西省| 二手房| 长寿区| 平安县| 北宁市| 宜兰市| 罗田县| 张掖市| 广宗县| 西华县| 恩平市| 宜兰市| 浮山县| 宜丰县| 伽师县| 辛集市| 厦门市| 建宁县| 辽中县| 克东县| 罗江县|