久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

linux - python 抓取公眾號文章遇到驗證問題

瀏覽:117日期:2022-06-25 14:22:41

問題描述

linux 下抓取微信公眾號文章遇到驗證問題!!!!!!!!

這是我要抓取的人民日報鏈接:http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1:首先瀏覽器上訪問是正常的。2:linux下訪問提示需要驗證,以下是簡單的代碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

訪問的結(jié)果如下:linux - python 抓取公眾號文章遇到驗證問題

補充說明下公眾號鏈接的獲取方式:1:先訪問鏈接:http://weixin.sogou.com/weixi...2:再獲取人民日報公眾號的鏈接進行跳轉(zhuǎn)。

問題解答

回答1:

都不模擬header請求頭的,就能抓取嗎,建議先模擬request header再試一下

回答2:

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3:

linux - python 抓取公眾號文章遇到驗證問題

現(xiàn)在在請求中加了header后,返回的錯誤是這樣的。請各位大神麻煩再支下招

回答4:用request可以,本地環(huán)境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)內(nèi)容在紅色框那一行

linux - python 抓取公眾號文章遇到驗證問題

linux - python 抓取公眾號文章遇到驗證問題

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 顺昌县| 南涧| 镇赉县| 铜梁县| 碌曲县| 勃利县| 海伦市| 玉树县| 玉门市| 峨眉山市| 虹口区| 安新县| 保山市| 亳州市| 木兰县| 石屏县| 黄冈市| 昆明市| 西乌珠穆沁旗| 梅河口市| 惠州市| 昌吉市| 庐江县| 凤台县| 贵州省| 麻江县| 同仁县| 九龙城区| 满城县| 故城县| 饶阳县| 柯坪县| 噶尔县| 秭归县| 天峨县| 高安市| 阿克苏市| 连南| 徐水县| 定安县| 海淀区|