文章詳情頁
如何提高python查詢速度?
瀏覽:143日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關新聞,一開始設想的是,當有新的新聞動態發布,程序通過郵件發送最新內容到郵箱。
所以我想把新聞標題,內容存到數據庫里,當內容更新時,把新的內容和數據庫的標題列表對比,看是不是已存在的,如果已存在,那就不發送,如果沒有,那發送到郵箱。
但數量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務去重
抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內存,提升效率
相關文章:
1. python - 數據與循環次數對應不上2. mysql - 把一個表中的數據count更新到另一個表里?3. 請教使用PDO連接MSSQL數據庫插入是亂碼問題?4. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處5. Python爬蟲如何爬取span和span中間的內容并分別存入字典里?6. 視頻文件不能播放,怎么辦?7. mysql 查詢身份證號字段值有效的數據8. python - 爬蟲模擬登錄后,爬取csdn后臺文章列表遇到的問題9. node.js - nodejs開發中常用的連接mysql的庫10. 黑客 - Python模塊安全權限
排行榜
