久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

javascript - nodejs抓取網站的翻頁判斷和言語判斷問題.

瀏覽:142日期:2023-09-14 08:12:31

問題描述

網址 http://www.everlight.com/news...兩個問題 1 : 怎么取得每頁的url2 是 點開新聞的內容, 比如 http://www.everlight.com/news...如果是英文的操作系統,顯示的是英語新聞,如果是中文系統,則顯示中文新聞,我想在node里面固定抓取英文新聞,怎么處理.

問題解答

回答1:

問題關閉...

在post的時候,form里面有幾個關鍵性的數據,是放在也沒的hidden變量里面,指定了這些變量應該就能解決.

回答2:

右上角有個切換語言的,看一下代碼,是調用了這個函數:function __doPostBack(eventTarget, eventArgument) {

if (!theForm.onsubmit || (theForm.onsubmit() != false)) { theForm.__EVENTTARGET.value = eventTarget; theForm.__EVENTARGUMENT.value = eventArgument; theForm.submit();}

}

其實就是提交了一下表單,而表單是有post的方式發送的原頁面所以,你點擊后會看到頁面有閃一下,但網址并沒有變化。所以,如果你要英文版的,post方式傳參數:__EVENTTARGET='ctl00$ctl00$lBtnUSA'過去就可以獲得英文版的頁面。

獲取頁面內的url,去解析dom就行了。

獲取頁面中的url的方法:

var jsdom = require('jsdom'); jsdom.env({ url: 'http://www.everlight.com/newsdetail.aspx?pcseq=4&cseq=7&seq=291', scripts: ['http://code.jquery.com/jquery.js'], done: function (err, window) { var $ = window.$; console.log('HN Links'); $('a').each(function() { //console.log(' -', $(this).text()); var tmp=$(this).text()+'---'+$(this).attr('href'); console.log(tmp); }); }});回答3:

這個還是分析一下request 中的header信息吧,里面有一項是可以利用設置語言的javascript - nodejs抓取網站的翻頁判斷和言語判斷問題.

標簽: JavaScript
相關文章:
主站蜘蛛池模板: 鄂托克前旗| 长治县| 宜君县| 肇庆市| 湾仔区| 榆林市| 建德市| 乌鲁木齐市| 沅陵县| 东方市| 寻甸| 阿勒泰市| 逊克县| 吉林市| 鲁山县| 康平县| 庆安县| 大石桥市| 保德县| 勐海县| 北安市| 平昌县| 建平县| 宁波市| 隆子县| 霸州市| 英德市| 武安市| 雷山县| 边坝县| 镇康县| 华容县| 沂源县| 亚东县| 达州市| 长治县| 澜沧| 岳西县| 仙桃市| 新邵县| 若羌县|