文章詳情頁

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？

瀏覽：217日期：2022-09-03 18:57:11

問題描述

import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html

比如這個爬蟲，輸出狀態碼是200。

可是直接訪問http://www.sxxrcs.com/was5/web/是404，抓包響應的也是404，請問這是為什么？

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？

問題解答

回答1：

用requests吧

import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2：

200正常啊，requests方便快捷。

Python 編程

上一條：python - 模擬滑動驗證碼，有源碼，求解下一條：python爬蟲時，抓取網頁遇到的問題？

相關文章：

1. 點擊頁面就自動輸入到mysql.求解2. java - IDEA從SVN檢出項目并在tomcat上運行求詳細流程3. javascript - windos下第一次用Django無法正確創建工程目錄4. java - 多叉樹求值，程序高手，算法高手看過來5. node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？6. node.js - nodejs使用formidable上傳文件問題7. Laravel中文件上傳的問題8. 單擊登錄按鈕無反應9. 誰能告訴我php7+tp5.1時遇到使用session::set()問題10. 靜態資源文件引入無效

排行榜

					
					點擊頁面就自動輸入到mysql.求解
java - 多叉樹求值，程序高手，算法高手看過來
javascript - windos下第一次用Django無法正確創建工程目錄
node.js - nodejs使用formidable上傳文件問題
node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？
java - IDEA從SVN檢出項目 并在tomcat上運行  求詳細流程
javascript - 在ie下為什么會出現這種情況呢 《 無法獲取未定義或 null 引用的屬性“length”》 ？請大神指教。
apache錯誤日志報錯，無法正常訪問網站
form表單中的label標簽
Hibernate Validator異常“找不到類型為java.lang.String的驗證器”
mysql - navicat 經常打開表一直在載入中 也不能關閉 著急解決
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？