久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

python爬蟲beautifulsoup解析html方法

瀏覽:50日期:2022-07-03 08:08:36

用BeautifulSoup 解析html和xml字符串

python爬蟲beautifulsoup解析html方法

實例:

#!/usr/bin/python# -*- coding: UTF-8 -*-from bs4 import BeautifulSoupimport re#待分析字符串html_doc = '''<html><head> <title>The Dormouse’s story</title></head><body><p class='title aq'> <b> The Dormouse’s story </b></p><p class='story'>Once upon a time there were three little sisters; and their names were <a rel='external nofollow' id='link1'>Elsie</a>, <a rel='external nofollow' id='link2'>Lacie</a> and <a rel='external nofollow' id='link3'>Tillie</a>; and they lived at the bottom of a well.</p><p class='story'>...</p>'''# html字符串創建BeautifulSoup對象soup = BeautifulSoup(html_doc, ’html.parser’, from_encoding=’utf-8’)#輸出第一個 title 標簽print soup.title#輸出第一個 title 標簽的標簽名稱print soup.title.name#輸出第一個 title 標簽的包含內容print soup.title.string#輸出第一個 title 標簽的父標簽的標簽名稱print soup.title.parent.name#輸出第一個 p 標簽print soup.p#輸出第一個 p 標簽的 class 屬性內容print soup.p[’class’]#輸出第一個 a 標簽的 href 屬性內容print soup.a[’href’]’’’soup的屬性可以被添加,刪除或修改. 再說一次, soup的屬性操作方法與字典一樣’’’#修改第一個 a 標簽的href屬性為 http://www.baidu.com/soup.a[’href’] = ’http://www.baidu.com/’#給第一個 a 標簽添加 name 屬性soup.a[’name’] = u’百度’#刪除第一個 a 標簽的 class 屬性為del soup.a[’class’]##輸出第一個 p 標簽的所有子節點print soup.p.contents#輸出第一個 a 標簽print soup.a#輸出所有的 a 標簽,以列表形式顯示print soup.find_all(’a’)#輸出第一個 id 屬性等于 link3 的 a 標簽print soup.find(id='link3')#獲取所有文字內容print(soup.get_text())#輸出第一個 a 標簽的所有屬性信息print soup.a.attrsfor link in soup.find_all(’a’): #獲取 link 的 href 屬性內容 print(link.get(’href’))#對soup.p的子節點進行循環輸出 for child in soup.p.children: print(child)#正則匹配,名字中帶有b的標簽for tag in soup.find_all(re.compile('b')): print(tag.name)

爬蟲設計思路:

python爬蟲beautifulsoup解析html方法

詳細手冊:

https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

到此這篇關于python爬蟲beautifulsoup解析html方法 的文章就介紹到這了,更多相關beautifulsoup解析html內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 苏尼特右旗| 阜城县| 龙海市| 会东县| 北票市| 郸城县| 宜都市| 佳木斯市| 赣榆县| 平顺县| 岚皋县| 固阳县| 香格里拉县| 广汉市| 兴城市| 汶川县| 调兵山市| 德庆县| 泸西县| 达尔| 安远县| 辰溪县| 永善县| 吉木萨尔县| 瑞安市| 伊春市| 夏津县| 兴隆县| 鹿泉市| 北川| 临城县| 宁晋县| 西宁市| 都匀市| 鹤峰县| 汤阴县| 东丰县| 习水县| 漠河县| 昌平区| 深圳市|