python 多進程使用
問題描述
假設:有個數據操作,處理100萬條數據,每個數據的value+1。如簡單代碼假設
for x in range(1,100): x++
從數據庫獲取100條了,然后想多進程去執行x++?還是說多進程去數據庫獲取數據?謝謝了
問題解答
回答1:有一個問題: 如果是數據庫里面的數據, 為什么不執行sql,這比什么多進程要高效的多吧?如果非要你給出的二選一, 那么考慮一下:
1). 如果你要用多進程去數據庫獲取數據(就算你用了mysql連接池,可以不怎么考慮數據庫連接的io消耗),你每取一次數據,總要有一次查詢吧, 完了以后,你還要把更新后的數據寫入到數據庫了, 又是一次數據庫操作,想想這個消耗有多大?2). 數據庫獲取100萬數據,然后想多進程去執行x++; 這種情況啊,只要計算機內存夠(只有100萬數據,基本是沒問題的), 用python的進程池map一下,確實也是沒什么問題回答2:
先將原始數據存入隊列(queue)中,作為生產者后從隊列中取數據,執行操作,作為消費者這時,可以在消費者開多線程(當然你鎖處理得好的話,生產者也可以做多線程)
while tmp_queue.empty() is not True: x = tmp_queue.get() x += 1
在隊列中,如果一直存在元素線程會持續進行操作。
回答3:其實Python中實現多進程的最佳方式是使用multiprocessing中的map
例子(Python 3):
# f.py# 要對某個列表中每個元素都執行一次的functiondef f(x): return x + 1
# main.pyfrom multiprocessing import poolfrom f import f# 創建進程池p = pool.Pool(4)lst = range(100)# 使用多進程對整個列表進行計算print(p.map(f, lst))回答4:
你可以直接把數據讀取和數據+1兩個函數再寫到一個操作中啊,然后用多進程去操作,就上樓上說的一樣用進程池進行操作。根據你的cpu核數,設置進程池的大小。由于多進程間不進行內存共享、也不能直接通信,你先用多進程從數據庫中把所有數據讀出來,然后再用多進程進行val+1也行的
相關文章:
1. mysql 查詢身份證號字段值有效的數據2. python bottle跑起來以后,定時執行的任務為什么每次都重復(多)執行一次?3. 視頻文件不能播放,怎么辦?4. html5 - HTML代碼中的文字亂碼是怎么回事?5. python - 爬蟲模擬登錄后,爬取csdn后臺文章列表遇到的問題6. visual-studio - Python OpenCV: 奇怪的自動補全問題7. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處8. javascript - 彈出一個子窗口,操作之后關閉,主窗口會得到相應的響應,例如網站的某些登錄界面,django后臺的管理等,這是怎么實現的呢?9. javascript - ios返回不執行js怎么解決?10. android - 分享到微信,如何快速轉換成字節數組
