文章詳情頁

linux - python 抓取公眾號文章遇到驗證問題

瀏覽：117日期：2022-06-25 14:22:41

問題描述

linux 下抓取微信公眾號文章遇到驗證問題！！！！！！！！

這是我要抓取的人民日報鏈接：http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1：首先瀏覽器上訪問是正常的。2：linux下訪問提示需要驗證，以下是簡單的代碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

訪問的結(jié)果如下： linux - python 抓取公眾號文章遇到驗證問題

補充說明下公眾號鏈接的獲取方式：1：先訪問鏈接：http://weixin.sogou.com/weixi...2：再獲取人民日報公眾號的鏈接進行跳轉(zhuǎn)。

問題解答

回答1：

都不模擬header請求頭的，就能抓取嗎，建議先模擬request header再試一下

回答2：

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3：

linux - python 抓取公眾號文章遇到驗證問題

現(xiàn)在在請求中加了header后，返回的錯誤是這樣的。請各位大神麻煩再支下招

回答4：用request可以,本地環(huán)境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)內(nèi)容在紅色框那一行

linux - python 抓取公眾號文章遇到驗證問題

Python 編程

上一條：python - linux 下用wsgifunc 運行web.py該如何修改代碼下一條：linux - python 安裝 Anaconda 環(huán)境變量問題請教

相關(guān)文章：

1. 點擊頁面就自動輸入到mysql.求解2. java - IDEA從SVN檢出項目并在tomcat上運行求詳細流程3. node.js - nodejs使用formidable上傳文件問題4. javascript - windos下第一次用Django無法正確創(chuàng)建工程目錄5. node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？6. java - 多叉樹求值，程序高手，算法高手看過來7. javascript - JS用ajax爬取百度外賣店家信息8. android - 安卓做前端，PHP做后臺服務(wù)器有什么需要注意的？9. html5 - 有人做過防微信app界面的H5 demo嗎？10. css - 請問B站頂部的模糊半透明導航條是怎么實現(xiàn)的呢？

排行榜

					
					點擊頁面就自動輸入到mysql.求解
java - 多叉樹求值，程序高手，算法高手看過來
javascript - windos下第一次用Django無法正確創(chuàng)建工程目錄
node.js - nodejs使用formidable上傳文件問題
node.js - 帶有node_modules目錄的項目，用phpstorm打開速度極慢，怎么解決？
java - IDEA從SVN檢出項目 并在tomcat上運行  求詳細流程
javascript - 在ie下為什么會出現(xiàn)這種情況呢 《 無法獲取未定義或 null 引用的屬性“l(fā)ength”》 ？請大神指教。
Hibernate Validator異常“找不到類型為java.lang.String的驗證器”
html5 - 有人做過防微信app界面的H5 demo嗎？
java的unsafe是什么，怎么理解比較好？
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

linux - python 抓取公眾號文章遇到驗證問題