java - mysql單表流水500W數(shù)據(jù)多維度統(tǒng)計(jì)的方案
問(wèn)題描述
現(xiàn)在項(xiàng)目中有張流水表結(jié)構(gòu)大概如下id sdkVersion jarVersion countryCode imei createTime
以前的需求是按sdkVersion,jarVersion,countryCode的分組求總數(shù)和imei排重后的總數(shù),大致sql如下:
select sdkVersion,jarVersion,countryCode,count(*),count(distinct imei) from xxx where createTime = ’xxxx-xx-xx’group by sdkVersion,jarVersion,countryCode
查出前一天的所有數(shù)據(jù)然后匯總到一張表里,結(jié)構(gòu)大概如下
id sdkVersion jarVersion countryCode count(*) count(distinct imei) createTime
然后現(xiàn)在的需求是要任意緯度的組合查詢,就是可以group by sdkVersiongroup by jarVersiongroup by countryCodegroup by sdkVersion,countryCode等等各種組合,如果按以前的每日匯總方案的話就要為不同的緯度組合建立很多個(gè)表,有什么好的方案可以解決這種問(wèn)題?或者是用專門的統(tǒng)計(jì)框架可以解決的?
問(wèn)題解答
回答1:樓主可以去看看PipelineDB流式數(shù)據(jù)庫(kù)
回答2:apache kylin, 亞秒級(jí)olap
回答3:每日匯總的話,實(shí)時(shí)性要求并不高,500W 記錄也還在可以處理的范圍內(nèi),視圖 + 定時(shí)計(jì)劃,可以滿足要求,不需要建多表。題主最好能說(shuō)明一下有什么瓶頸或者痛點(diǎn),畢竟 mysql 是個(gè)成熟產(chǎn)品,換用新銳技術(shù)有一定風(fēng)險(xiǎn)。
回答4:寫存儲(chǔ)過(guò)程,每天定時(shí)跑就行了
相關(guān)文章:
1. python - 數(shù)據(jù)與循環(huán)次數(shù)對(duì)應(yīng)不上2. mysql - 把一個(gè)表中的數(shù)據(jù)count更新到另一個(gè)表里?3. 請(qǐng)教使用PDO連接MSSQL數(shù)據(jù)庫(kù)插入是亂碼問(wèn)題?4. mysql - 分庫(kù)分表、分區(qū)、讀寫分離 這些都是用在什么場(chǎng)景下 ,會(huì)帶來(lái)哪些效率或者其他方面的好處5. Python爬蟲(chóng)如何爬取span和span中間的內(nèi)容并分別存入字典里?6. 視頻文件不能播放,怎么辦?7. mysql 查詢身份證號(hào)字段值有效的數(shù)據(jù)8. python - 爬蟲(chóng)模擬登錄后,爬取csdn后臺(tái)文章列表遇到的問(wèn)題9. node.js - nodejs開(kāi)發(fā)中常用的連接mysql的庫(kù)10. 黑客 - Python模塊安全權(quán)限
