2021-03-11
閱讀量:
495
如何整理不同來(lái)源的數(shù)據(jù)?
問(wèn):
如何整理不同來(lái)源的數(shù)據(jù)?
答:
數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常從多個(gè)數(shù)據(jù)源中提取,整合、匯總后成為數(shù)據(jù)倉(cāng)庫(kù)中的歷史記錄。多個(gè)數(shù)據(jù)源
(內(nèi)部業(yè)務(wù)數(shù)據(jù)庫(kù)、外部文件、爬蟲、第三方API等等)的數(shù)據(jù)存儲(chǔ)方式不同,所以需要經(jīng)過(guò)抽取、清
洗、轉(zhuǎn)換。
數(shù)據(jù)從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)的處理過(guò)程就是ETL(Extract-Transform-Load):
1.Extract:數(shù)據(jù)抽取,就是把數(shù)據(jù)從多個(gè)數(shù)據(jù)源讀出來(lái)
2.Transform:數(shù)據(jù)轉(zhuǎn)換,就是把數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式
3.Load:數(shù)據(jù)加載,把處理后的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論