2018-10-19
閱讀量:
1405
HIVE中索引、分區(qū)、分桶的區(qū)別?
① 索引和分區(qū)最大的區(qū)別就是索引不分割數(shù)據(jù)庫,分區(qū)分割數(shù)據(jù)庫。
索引其實就是拿額外的存儲空間換查詢時間,但分區(qū)已經(jīng)將整個大數(shù)據(jù)庫按照分區(qū)列拆分成多個小數(shù)據(jù)庫了。
② 分區(qū)和分桶最大的區(qū)別就是分桶隨機分割數(shù)據(jù)庫,分區(qū)是非隨機分割數(shù)據(jù)庫。
分桶是按照列的哈希函數(shù)進(jìn)行分割的,相對比較平均;而分區(qū)是按照列的值來進(jìn)行分割的,容易造成數(shù)據(jù)傾斜。
分桶是對應(yīng)不同的文件(細(xì)粒度),分區(qū)是對應(yīng)不同的文件夾(粗粒度)






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
1條評論
0條評論
0條評論