文章詳情頁
python - pyspider 定時爬取問題
瀏覽:116日期:2022-07-14 10:37:31
問題描述
在寫爬蟲的時候,發現 在代碼中設置了 every 之后,21號爬取了一次之后,今天看 result 沒有更新,那個 lastcrawltime 依舊是 21號的。請問是不是我的參數設置的不正確?
問題解答
回答1:你貼的這個 task 的圖,是什么任務的?
貼的是 detail_page 的任務的
題主給 index_page 設置了小于 cronjob 間隔的時間。然而沒有給 detail_page 設置。這樣 detail_page 是不會被重新調度的
project 隊列狀態,最近活動任務是怎樣的?
回答2:有可能是 every 和 age 不匹配。如果 age 沒問題的話,說實話這屬于疑難雜癥了,我也經常遇到,我都是去 taskdb 把相應的表清空,然后重啟 pyspider 重新運行項目
相關文章:
1. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處2. javascript - ios返回不執行js怎么解決?3. python - 爬蟲模擬登錄后,爬取csdn后臺文章列表遇到的問題4. 視頻文件不能播放,怎么辦?5. python bottle跑起來以后,定時執行的任務為什么每次都重復(多)執行一次?6. html5 - HTML代碼中的文字亂碼是怎么回事?7. javascript - 求幫助 , ATOM不顯示界面!!!!8. mysql 查詢身份證號字段值有效的數據9. javascript - angular使從elastichearch中取出的文本高亮顯示,如圖所示10. javascript - 為什么在谷歌控制臺 輸出1的時候,輸出的1立馬就不見了
排行榜
