久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

如何提高python查詢速度?

瀏覽:168日期:2022-06-29 18:39:57

問題描述

最近在爬股票的相關(guān)新聞,一開始設(shè)想的是,當(dāng)有新的新聞動態(tài)發(fā)布,程序通過郵件發(fā)送最新內(nèi)容到郵箱。

所以我想把新聞標(biāo)題,內(nèi)容存到數(shù)據(jù)庫里,當(dāng)內(nèi)容更新時,把新的內(nèi)容和數(shù)據(jù)庫的標(biāo)題列表對比,看是不是已存在的,如果已存在,那就不發(fā)送,如果沒有,那發(fā)送到郵箱。

但數(shù)量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?

問題解答

回答1:

爬蟲任務(wù)去重

抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。

回答2:

去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內(nèi)存,提升效率

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 南京市| 申扎县| 上饶市| 莎车县| 马关县| 云浮市| 丰城市| 和顺县| 堆龙德庆县| 洞头县| 海晏县| 凤台县| 西贡区| 绍兴市| 都江堰市| 江都市| 湘乡市| 舟曲县| 抚远县| 上饶市| 云和县| 沐川县| 科技| 分宜县| 衡东县| 广水市| 安溪县| 宜丰县| 方正县| 东乌珠穆沁旗| 南溪县| 溆浦县| 永泰县| 丰原市| 民勤县| 凭祥市| 滦平县| 濮阳市| 霍林郭勒市| 文水县| 进贤县|