文章詳情頁

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

瀏覽：194日期：2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接，如下圖紅色小框：

發現抓下來的xls只有報錯信息：

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

請問要怎樣才能把有內容的xls抓下來？

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1：

可以在標紅線的url上看到返回的公司信息，剩下的就是模擬瀏覽器請求這個url了，request header中的refer一定不能省略，不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2：

查看cookie,referer

Python 編程

上一條：python - 關于樹模型是否需要對離散型變量作onehot？下一條：cookies - python用cookie登錄網站失敗

排行榜

					
					Docker for Mac 創建的dnsmasq容器連不上/不工作的問題
docker安裝后出現Cannot connect to the Docker daemon.
為什么我ping不通我的docker容器呢？？？
docker - 如何修改運行中容器的配置
angular.js - angular內容過長展開收起效果
html5 - 這個代碼顯示功能如何實現？
javascript - 用JS 七牛上傳圖片出現文件已存在的錯誤（file exists）
Android Canvas 如何在已有的圖形下面進行繪制？
我想問下在華為android 6.0的手機上修改EditText光標顏色不成功，但是小米6.0上卻能成功，這該如何解決？？？？
angular.js - ui-router 有沒有手動重新加載路由配置的方法？
javascript - 使用angular 的ui-sref 中出現了中文參數，點擊跳轉后瀏覽器的地址欄里出現轉義后的%AE....%a%4
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。