2018-10-19
閱讀量:
1449
HIVE中索引、分區(qū)、分桶的區(qū)別?
① 索引和分區(qū)最大的區(qū)別就是索引不分割數(shù)據(jù)庫(kù),分區(qū)分割數(shù)據(jù)庫(kù)。
索引其實(shí)就是拿額外的存儲(chǔ)空間換查詢時(shí)間,但分區(qū)已經(jīng)將整個(gè)大數(shù)據(jù)庫(kù)按照分區(qū)列拆分成多個(gè)小數(shù)據(jù)庫(kù)了。
② 分區(qū)和分桶最大的區(qū)別就是分桶隨機(jī)分割數(shù)據(jù)庫(kù),分區(qū)是非隨機(jī)分割數(shù)據(jù)庫(kù)。
分桶是按照列的哈希函數(shù)進(jìn)行分割的,相對(duì)比較平均;而分區(qū)是按照列的值來(lái)進(jìn)行分割的,容易造成數(shù)據(jù)傾斜。
分桶是對(duì)應(yīng)不同的文件(細(xì)粒度),分區(qū)是對(duì)應(yīng)不同的文件夾(粗粒度)






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論