久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

<strike id="s4g0u"></strike>

<strike id="s4g0u"></strike>

<tr id="s4g0u"></tr>

<ul id="s4g0u"><pre id="s4g0u"></pre></ul>

文章詳情頁

Python爬蟲如何爬取span和span中間的內容并分別存入字典里？

瀏覽：136日期：2022-07-15 16:32:54

問題描述

我想把房屋概況分別抓出來并分別作為獨立的列存儲進字典里，但是行內元素沒有辦法直接用for循環摳出來。這是我的代碼：

soup.select(’.house-info li’)[1].text.strip()

這是網頁html代碼：

<li><span class='info-tit'>房屋概況：</span>住宅<span class='splitline'>|</span>1室1廳1衛<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>

問題解答

回答1：

其實還是很有簡單的，你看這個還是有規律的，規律在于有分隔符|，我寫了個DEMO

something = ’’’<li><span class='info-tit'>房屋概況：</span>住宅 <span class='splitline'>|</span>1室1廳1衛<span class='splitline'>|</span><span>46m2</span><span class='splitline'>|</span> (高層)/共18層<span class='splitline'>|</span>南北<span class='splitline'>|</span> 豪華裝修 </li>’’’;soup = BeautifulSoup(something, ’lxml’)plaintext = soup.select(’li’)[0].get_text().strip()

通過get_text()得到內在所有內容，然后去除空格。后面你就用split進行分割吧，后面的不寫了。如果有問題再交流。

回答2：我感覺這個html代碼寫錯了呢,標簽的內容文本在標簽外面

Python爬蟲如何爬取span和span中間的內容并分別存入字典里？

正確的標簽內容就兩個:

房屋概況：

46m2

回答3：

innerText

回答4：

你這種情況，我覺得用 for 循環加上正則表達式是最方便的，如果所有模版都是這樣固定的話

回答5：

用pyquery吧

from pyquery import PyQuery as Q

Q(text).find(’.house-info li’).text()

Python 編程

上一條：python文檔怎么查看？下一條：python class嵌套怎么訪問父類

相關文章：

1. javascript - 在 model里定義的引用表模型時，model為undefined。2. python3.x - c++調用python33. css3 - 沒明白盒子的height隨width的變化這段css是怎樣實現的?4. atom開始輸入！然后按tab只有空格出現沒有html格式出現5. css3 - 這個右下角折角用css怎么畫出來？6. javascript - 一個關于客戶端和前端通信的疑惑？7. mysql cant connect to mysql server 3306 偶爾出現這個是什么原因呢8. debian - docker依賴的aufs-tools源碼哪里可以找到啊？9. java - 根據月份查詢多個表里的內容怎么實現好？10. android - 課程表點擊后浮動后邊透明可以左右滑動的界面是什么？

排行榜

					
					關于docker下的nginx壓力測試
為什么我ping不通我的docker容器呢？？？
angular.js - angular內容過長展開收起效果
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
android - 課程表點擊后浮動后邊透明可以左右滑動的界面是什么？
css3 - 沒明白盒子的height隨width的變化這段css是怎樣實現的?
css3 - 這個右下角折角用css怎么畫出來？
python3.x - c++調用python3
java - 根據月份查詢多個表里的內容怎么實現好？
javascript - 一個關于客戶端和前端通信的疑惑？
javascript - 在 model里定義的 引用表模型時，model為undefined。
				

熱門標簽

主站蜘蛛池模板：梁平县| 上林县| 北碚区| 常山县| 南川市| 苏州市| 阳江市| 开原市| 资兴市| 喀喇| 海晏县| 崇文区| 东兴市| 南陵县| 酉阳| 美姑县| 高清| 调兵山市| 曲阳县| 南溪县| 汕头市| 舟山市| 武乡县| 同德县| 昌都县| 孝义市| 财经| 仙桃市| 哈巴河县| 黄骅市| 桑日县| 平邑县| 广德县| 杨浦区| 迭部县| 固镇县| 安福县| 华安县| 务川| 梨树县| 拉孜县|

<ul id="sieku"><center id="sieku"></center></ul>