2020-07-04
閱讀量:
1127
很多小文件需要導入到一張hive表里面,但是一個個導入非常麻煩?
使用MSCK命令導入輸入到hive表
我們有時候會遇到很多小文件需要導入到一張hive表里面,但是一個個導入非常麻煩。
假設創(chuàng)建一個外部表,這個表在hdfs的order文件夾里,但是這個文件夾現(xiàn)在是空的。所以用select * 是沒有數據的。
CREATE EXTERNAL TABLE order(
order STRING
, time STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
LOCATION '/hive/order';
我們通過hdfs dfs -put 方式把數據導入到hdfs的order 文件夾下。
然后在hive里面輸入命令 msck repair table order;
現(xiàn)在再select * 就有數據了。通過這種方式,可以很快導入數據到表格里面,而不用一個個alter ...add partition來導入。






評論(0)


暫無數據
推薦帖子
0條評論
1條評論
0條評論