久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽:96日期:2022-09-05 14:29:29

問題描述

<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁,現在用re模塊想抓取**第7行**的中文內容,放在一個組里面(.*?)。正則老是匹配不上,用換行符也匹配不上,不知道怎么寫了。。。

問題解答

回答1:

既然你都用bs4解析了,為什么不用它提取哪?bs4內有一個stripped_string的函數正好滿足你的需要。

回答2:

import repattern = re.compile(r’</span>.*?</span>(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3:

const re = /^</span>(.*)</dd>$/

這樣可以不?

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 乌苏市| 宜川县| 南昌市| 即墨市| 麻江县| 独山县| 安康市| 安龙县| 昭平县| 德安县| 泗洪县| 大同市| 叶城县| 汨罗市| 辽源市| 甘肃省| 武陟县| 历史| 卢氏县| 贵南县| 乐昌市| 张家川| 永吉县| 霍城县| 吉木乃县| 松潘县| 达尔| 赤城县| 静乐县| 鄂托克旗| 嘉鱼县| 正安县| 双流县| 陆良县| 庆云县| 京山县| 齐齐哈尔市| 岗巴县| 汉寿县| 托克逊县| 库车县|