文章詳情頁(yè)

解決python存數(shù)據(jù)庫(kù)速度太慢的問(wèn)題

瀏覽：4日期：2022-06-23 10:40:39

問(wèn)題

在項(xiàng)目中遇到一個(gè)問(wèn)題，需要從文本中讀取三萬(wàn)條數(shù)據(jù)寫入mysql數(shù)據(jù)庫(kù)，文件中為用@分割的sql語(yǔ)句，但是在讀取的過(guò)程中發(fā)現(xiàn)速度過(guò)慢，三萬(wàn)八千條數(shù)據(jù)需要220秒，問(wèn)題代碼片段如下：

def read_to_mysql(filecata, targetDir): ’’’ 用來(lái)寫入數(shù)據(jù)庫(kù)，寫入后會(huì)剪貼掉文件 filecata 為保存有文件地址的list，已去掉尾部的空格 :param filecata: 文件目錄 :param targetDir: 要復(fù)制的目標(biāo)目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) conn.commit() print(flag) copy_del_file(filecata, targetDir) # 用來(lái)剪切的函數(shù)，此處不影響，因而省略 cursor.close() conn.close()解決方案

經(jīng)測(cè)試發(fā)現(xiàn)，影響速度的主要原因是commit(),因?yàn)闆](méi)過(guò)幾秒提交一次即可，但是因?yàn)樘峤坏淖址L(zhǎng)度有限制，所以要設(shè)置一個(gè)合理的時(shí)間讀取，代碼修改如下：

def read_to_mysql(filecata, targetDir): ’’’ 用來(lái)寫入數(shù)據(jù)庫(kù)，寫入后會(huì)剪貼掉文件 filecata 為保存有文件地址的list，已去掉尾部的空格 :param filecata: :param targetDir: 要復(fù)制的目標(biāo)目錄 :return: ’’’ root_dir = os.path.abspath(os.path.join(os.getcwd(), './')) config = configparser.ConfigParser() config.read(root_dir + '/config.ini') __host = config.get('DatabaseOfWRT', 'host') __database_name = config.get('DatabaseOfWRT', 'database') __user_name = config.get('DatabaseOfWRT', 'username') __user_passwaord = config.get('DatabaseOfWRT', 'password') __charset = config.get('DatabaseOfWRT', 'charset') conn = pymysql.connect( host=__host, user=__user_name, password=__user_passwaord, database=__database_name, charset=__charset ) cursor = conn.cursor() with open(filecata, 'r', encoding=’utf-8’) as f: data = f.read() # 讀取文件 data_list = data.split(’@’) del data_list[-1] starttime = int(time.time()) for data_str in data_list: endtime = int(time.time()) data_str = str(data_str) sql = data_str + ’;’ cursor.execute(sql) if endtime - starttime ==10: # 每過(guò)十秒提交一次 starttime = int(time.time()) conn.commit() conn.commit() copy_del_file(filecata, targetDir) cursor.close() conn.close() return flag

此時(shí)寫入三萬(wàn)八千條數(shù)據(jù)需要9秒

補(bǔ)充：python 連數(shù)據(jù)庫(kù)cursur.fetchall ()速度慢的解決方案

解決游標(biāo)遍歷慢的方法：

一行一行去遍歷，而不是一下全部讀取出來(lái)

將cursur.fetchall()更改為for i in cursur:

補(bǔ)充：python 讀取文件時(shí)速度的問(wèn)題

'''舉例讀取文件'''# 第一種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: info = f.readlines() for line in info: pass# 第二種方式with open(’test.txt’, ’r’, encoding=’utf-8’) as f: for line in f: pass

對(duì)于以上兩種方式讀取文件，各自有各自的用途，當(dāng)用兩種方式都可以時(shí)，第二種方式的效率是第一種的幾個(gè)量級(jí)， readlines()將文件內(nèi)容讀取到內(nèi)存的list中，操作雖然方便，但是消耗內(nèi)存，運(yùn)行效率慢。

原生的f是將文件內(nèi)容讀到生成器中，當(dāng)需要操作時(shí)，從生成器中循環(huán)出來(lái)，速度很快，操作大文件時(shí)建議用第二種方式！

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持好吧啦網(wǎng)。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教。

Python 編程

上一條：python實(shí)現(xiàn)高效的遺傳算法下一條：python pyecharts庫(kù)的用法大全

相關(guān)文章：

1. 無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁(yè)2. 八種Vue組件間通訊方式合集(推薦)3. Python opencv操作深入詳解4. Android實(shí)現(xiàn)觸發(fā)html頁(yè)面的Button控件點(diǎn)擊事件方式5. PHP網(wǎng)站漏洞的相關(guān)總結(jié)6. PHP8.0新功能之Match表達(dá)式的使用7. JavaScript設(shè)計(jì)模式之策略模式實(shí)現(xiàn)原理詳解8. Nginx+php配置文件及原理解析9. JavaScript基于用戶照片姓名生成海報(bào)10. ajax請(qǐng)求添加自定義header參數(shù)代碼

排行榜

					
					無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁(yè)
IntelliJ IDEA 2021.1 首個(gè) Beta 版本發(fā)布
Django Auth用戶認(rèn)證組件實(shí)現(xiàn)代碼
PHP驗(yàn)證碼工具－Securimage
Android實(shí)現(xiàn)觸發(fā)html頁(yè)面的Button控件點(diǎn)擊事件方式
JavaScript設(shè)計(jì)模式之策略模式實(shí)現(xiàn)原理詳解
Django model class Meta原理解析
ajax請(qǐng)求添加自定義header參數(shù)代碼
PHP8.0新功能之Match表達(dá)式的使用
Nginx+php配置文件及原理解析
Python opencv操作深入詳解