久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

a標簽 url 正則怎么寫(python 或者js)

瀏覽:143日期:2022-07-17 17:06:50

問題描述

<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>

我要取 href里的鏈接

6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)

第二個和第三個鏈接相同 怎么去重復(python下)

問題解答

回答1:

# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:

提取前三個鏈接:

links= re.findall(r’href='http://m.baoyu77737.com/wenda/(.*?=rf)'’,l_string,re.S)

去重:

new_links=set(links)

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 大姚县| 华容县| 宜君县| 左云县| 栾城县| 普格县| 开阳县| 宜春市| 安塞县| 新乐市| 昌宁县| 宁远县| 黔南| 武邑县| 曲沃县| 尤溪县| 潮安县| 龙泉市| 长宁县| 府谷县| 玉林市| 多伦县| 伊金霍洛旗| 宣恩县| 同心县| 宜昌市| 馆陶县| 六盘水市| 泰和县| 文昌市| 万山特区| 全州县| 进贤县| 内乡县| 万山特区| 井陉县| 简阳市| 杭州市| 固镇县| 玉门市| 江都市|