久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

<th id="0em0a"></th>

<ul id="0em0a"><center id="0em0a"></center></ul>

<samp id="0em0a"><pre id="0em0a"></pre></samp>

<ul id="0em0a"><pre id="0em0a"></pre></ul>

文章詳情頁

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

瀏覽：123日期：2022-07-25 17:42:22

問題描述

寫了一小段代碼，爬取博客園博客中的圖片，這段代碼對部分鏈接有效，還有一部分鏈接一爬就報錯，這是什么原因呢？

#coding=utf-8import urllibimport refrom lxml import etree#解析地址def getHtml(url): page = urllib.urlopen(url) html = page.read() return html#獲取地址并建樹url = 'http://www.cnblogs.com/fnng/archive/2013/05/20/3089816.html'html = getHtml(url)html = html.decode('utf-8')tree = etree.HTML(html)#保存圖片至本地reg = r’src='http://m.baoyu77737.com/wenda/(.*?)' alt’imgre = re.compile(reg)imglist = re.findall(imgre, html)x = 0for imgurl in imglist: urllib.urlretrieve(imgurl, ’%s.jpg’ % x) x += 1

如圖，可以正確爬取圖片網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

若把url換為

url = 'http://www.cnblogs.com/baronzhang/p/6861258.html'

則立馬報錯

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

求解決，謝謝！

問題解答

回答1：

錯誤提示已經很明顯了，你去看下網頁源代碼，匹配到的第一張圖片是一個GIF格式的，并且還是相對路徑，所以你是下載不到的，故提示IOerror，就算你下載到了，因為你指定了格式為JPG，你也打不開。因此你需要做的就是判斷和篩選

for imgurl in imglist: if 'gif' not in imgurl:urllib.urlretrieve(imgurl, ’%s.jpg’ % x)x += 1

看下我增加的地方，當然這只是最簡單的判斷，但可以保證你第二個程序不會報錯，也是給你一個思路！

Python 編程

上一條：Python鏈接加中午，輸出中文不在鏈接里下一條：python - 關于單例的線程安全問題

相關文章：

1. nignx - docker內nginx 80端口被占用2. java - SSH框架中寫分頁時service層中不能注入分頁類3. angular.js - angular內容過長展開收起效果4. docker鏡像push報錯5. python3.x - python連oanda的模擬交易api獲取json問題第五問6. docker-machine添加一個已有的docker主機問題7. node.js - 我是一個做前端的，求教如何學習vue，node等js引擎？8. html5 - 百度echart官網下載的地圖json數據亂碼9. debian - docker依賴的aufs-tools源碼哪里可以找到啊？10. 關于docker下的nginx壓力測試

排行榜

					
					docker-machine添加一個已有的docker主機問題
nignx - docker內nginx 80端口被占用
docker鏡像push報錯
angular.js - angular內容過長展開收起效果
java - SSH框架中寫分頁時service層中不能注入分頁類
python3.x - python連oanda的模擬交易api獲取json問題第五問
關于docker下的nginx壓力測試
為什么我ping不通我的docker容器呢？？？
dockerfile - [docker build image失敗- npm install]
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
node.js - 我是一個做前端的，求教如何學習vue，node等js引擎？
				

熱門標簽

主站蜘蛛池模板：武陟县| 晋州市| 呼和浩特市| 凤庆县| 广饶县| 鸡东县| 郓城县| 永福县| 衡山县| 罗源县| 五家渠市| 疏勒县| 铜鼓县| 屯门区| 天门市| 咸丰县| 绥江县| 益阳市| 金昌市| 松原市| 海伦市| 上饶市| 无锡市| 闽侯县| 肥西县| 崇明县| 通辽市| 灵丘县| 如东县| 鸡东县| 民勤县| 泾阳县| 保山市| 仙桃市| 广饶县| 高雄县| 平塘县| 南靖县| 永登县| 会昌县| 加查县|

<ul id="ikkg0"><center id="ikkg0"></center></ul>

<strike id="ikkg0"><s id="ikkg0"></s></strike>

<samp id="ikkg0"><pre id="ikkg0"></pre></samp>

<ul id="ikkg0"><pre id="ikkg0"></pre></ul>

<ul id="ikkg0"><tbody id="ikkg0"></tbody></ul>

<ul id="ikkg0"><center id="ikkg0"></center></ul><ul id="ikkg0"><tbody id="ikkg0"></tbody></ul>