久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

python - 網(wǎng)頁title中包含換行,如何用正則表達式提取出來?

瀏覽:145日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網(wǎng)頁爬蟲,在爬取網(wǎng)頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網(wǎng)頁title中包含換行,如何用正則表達式提取出來?

所以導(dǎo)致原來的正則表達式無法使用,那么,問題來了,像這樣網(wǎng)頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 观塘区| 峨山| 景德镇市| 绥滨县| 宝应县| 土默特左旗| 营口市| 鞍山市| 阳高县| 淳化县| 彭泽县| 虹口区| 贵港市| 涡阳县| 福泉市| 通城县| 阿拉尔市| 吴川市| 汽车| 上林县| 普兰县| 霍林郭勒市| 峡江县| 云安县| 宜昌市| 左贡县| 新龙县| 噶尔县| 华坪县| 岑溪市| 封丘县| 厦门市| 莱西市| 板桥市| 定西市| 桂东县| 应用必备| 晴隆县| 利辛县| 松江区| 茂名市|