
教你輕松掌握數(shù)據(jù)倉(cāng)庫(kù)的規(guī)劃和構(gòu)建策略
數(shù)據(jù)倉(cāng)庫(kù)作為決策支持系統(tǒng)(DSS)的基礎(chǔ),具有面向主題的、集成的、不可更新的、隨時(shí)間不斷變化的特性。這些特點(diǎn)說明了數(shù)據(jù)倉(cāng)庫(kù)從數(shù)據(jù)組織到數(shù)據(jù)處理,都與原來的數(shù)據(jù)庫(kù)有很大的區(qū)別,這也就需要在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)設(shè)計(jì)時(shí)尋求一個(gè)適合于數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的方法。在一般的系統(tǒng)開發(fā)規(guī)劃中,首先需要確定系統(tǒng)的功能,這些系統(tǒng)的功能一般是通過對(duì)用戶的需求分析得到的。從數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用角度來看,DSS分析員一般是企業(yè)中的中高層管理人員,他們對(duì)決策支持的需求不能預(yù)先做出規(guī)范的說明,只能給設(shè)計(jì)人員一個(gè)抽象地描述。
這就需要設(shè)計(jì)人員在與用戶不斷的交流溝通中,將系統(tǒng)的需求逐步明確,并加以完善。因此數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)規(guī)劃過程實(shí)際上是一個(gè)用戶和設(shè)計(jì)人員對(duì)其不斷了解、熟悉和完善的過程。 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)應(yīng)用規(guī)劃是開發(fā)數(shù)據(jù)倉(cāng)庫(kù)的首要任務(wù)。只有制定了正確的數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃,才能使組織主要力量有序地實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)應(yīng)用。在數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃中一般需要經(jīng)歷這樣幾個(gè)過程:選擇實(shí)現(xiàn)策略、確定數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)目標(biāo)和實(shí)現(xiàn)范圍、選擇數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)、建立商業(yè)和項(xiàng)目規(guī)劃預(yù)算。 當(dāng)數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃完成后,需要編制相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃說明書,說明數(shù)據(jù)倉(cāng)庫(kù)與企業(yè)戰(zhàn)略的關(guān)系,以及與企業(yè)急需處理的、范圍相對(duì)有限的開發(fā)機(jī)會(huì),重點(diǎn)支持的職能部門和今后數(shù)據(jù)倉(cāng)庫(kù)開發(fā)工作的建議,實(shí)際使用方案和開發(fā)預(yù)算,作為數(shù)據(jù)倉(cāng)庫(kù)實(shí)際開發(fā)的依據(jù)。
1、選擇數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)策略
數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)策略主要有自頂向下、自底向上和這兩種策略的聯(lián)合使用。自頂向下策略在實(shí)際應(yīng)用中比較困難,因?yàn)?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉(cāng)庫(kù)的功能是一種決策支持功能。這種功能在企業(yè)戰(zhàn)略的應(yīng)用范圍中常常是很難確定的,因?yàn)?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用機(jī)會(huì)往往超出企業(yè)當(dāng)前的實(shí)際業(yè)務(wù)范圍,而且在開發(fā)前就確定目標(biāo),會(huì)在實(shí)現(xiàn)預(yù)定目標(biāo)后就不再追求新的應(yīng)用,是數(shù)據(jù)倉(cāng)庫(kù)喪失更有戰(zhàn)略意義的應(yīng)用。由于該策略在開發(fā)前就可以給出數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)范圍,能夠清楚地向決策者和企業(yè)描述系統(tǒng)的收益情況和實(shí)現(xiàn)目標(biāo),因此是一種有效的數(shù)據(jù)倉(cāng)庫(kù)開發(fā)策略。該方法使用時(shí)需要開發(fā)人員具有豐富的自頂向下開發(fā)系統(tǒng)的經(jīng)驗(yàn),企業(yè)決策層和管理人員完全知道數(shù)據(jù)倉(cāng)庫(kù)的預(yù)定目標(biāo)并且了解數(shù)據(jù)倉(cāng)庫(kù)能夠在那些決策中發(fā)揮作用。
自底向上策略一般從某個(gè)數(shù)據(jù)倉(cāng)庫(kù)原型開始,選擇一些特定的為企業(yè)管理人員所熟知的管理問題作為數(shù)據(jù)倉(cāng)庫(kù)開發(fā)的對(duì)象,在此基礎(chǔ)上進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)。因此,該策略常常用于一個(gè)數(shù)據(jù)集市、一個(gè)經(jīng)理系統(tǒng)或一個(gè)部門的數(shù)據(jù)倉(cāng)庫(kù)開發(fā)。該策略的優(yōu)點(diǎn)在于企業(yè)能夠以較小的投入,獲得較高的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用收益。在開發(fā)過程中,人員投入較少,也容易獲得成效。當(dāng)然,如果某個(gè)項(xiàng)目的開發(fā)失敗可能造成企業(yè)整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)開發(fā)的延遲。該策略一般用于企業(yè)洗碗對(duì)數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)進(jìn)行評(píng)價(jià),以確定該技術(shù)的應(yīng)用方式、地點(diǎn)和時(shí)間,或希望了解實(shí)現(xiàn)和運(yùn)行數(shù)據(jù)倉(cāng)庫(kù)所需要的各種費(fèi)用,或在數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用目標(biāo)并不是很明確時(shí),數(shù)據(jù)倉(cāng)庫(kù)對(duì)決策過程影響不是很明確時(shí)使用。
在自頂向下的開發(fā)策略中可以采用結(jié)構(gòu)化或面向?qū)ο蟮姆椒ǎ凑?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉(cāng)庫(kù)的規(guī)劃、需求確定、系統(tǒng)分析、系統(tǒng)設(shè)計(jì)、系統(tǒng)集成、系統(tǒng)測(cè)試和系統(tǒng)試運(yùn)行的階段完成數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)。而在自底向上的開發(fā)中,則可以采用螺旋式的原型開發(fā)方法,使用戶可以根據(jù)新的需求對(duì)試運(yùn)行的系統(tǒng)進(jìn)行修改。螺旋式的原型開發(fā)方法要求在較短的時(shí)間內(nèi)快速的生成可以不斷增加功能的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),這種開發(fā)方法主要適合于這樣一些場(chǎng)合:在企業(yè)的市場(chǎng)動(dòng)向和需求無法預(yù)測(cè),市場(chǎng)的時(shí)機(jī)是實(shí)現(xiàn)產(chǎn)品的重要組成部分,不斷地改進(jìn)對(duì)與企業(yè)的市場(chǎng)調(diào)節(jié)是必需的;持久的競(jìng)爭(zhēng)優(yōu)勢(shì)來自連續(xù)不斷地改進(jìn),系統(tǒng)地改進(jìn)是基于用戶在使用中的不斷發(fā)現(xiàn)。 自頂向下和自底向上策略的聯(lián)合使用具有兩種策略的優(yōu)點(diǎn),既能快速的完成數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)與應(yīng)用,還可建立具有長(zhǎng)遠(yuǎn)價(jià)值的數(shù)據(jù)倉(cāng)庫(kù)方案。但在實(shí)踐中往往難以操作,通常需要能夠建立、應(yīng)用和維護(hù)企業(yè)模型、數(shù)據(jù)模型和技術(shù)結(jié)構(gòu)的、具有豐富經(jīng)驗(yàn)的開發(fā)人員,能夠熟練的從具體(如業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù))轉(zhuǎn)移到抽象(只基于業(yè)務(wù)性質(zhì)而不是基于實(shí)現(xiàn)系統(tǒng)技術(shù)的邏輯模型);企業(yè)需要擁有由最終用戶和信息系統(tǒng)人員組成的有經(jīng)驗(yàn)的開發(fā)小組,能夠清楚地指出數(shù)據(jù)倉(cāng)庫(kù)在企業(yè)戰(zhàn)略決策支持中的應(yīng)用。
2、確定數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)目標(biāo)和實(shí)現(xiàn)范圍
為確定數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)目標(biāo)和實(shí)現(xiàn)范圍,首先需要對(duì)企業(yè)管理者等數(shù)據(jù)倉(cāng)庫(kù)用戶解釋數(shù)據(jù)倉(cāng)庫(kù)在企業(yè)管理中的應(yīng)用和發(fā)展趨勢(shì),說明企業(yè)組織和使用數(shù)據(jù)來支持跨功能系統(tǒng)的重要性,對(duì)企業(yè)經(jīng)營(yíng)戰(zhàn)略的支持,以確定開發(fā)目標(biāo)。在該階段確認(rèn)與使用數(shù)據(jù)倉(cāng)庫(kù)有關(guān)的業(yè)務(wù)要求,這些要求應(yīng)該只支持最主要的業(yè)務(wù)職能部門,將使用精力集中在收益明顯的業(yè)務(wù)上,使數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用立即產(chǎn)生效果,不應(yīng)該消耗太多的精力在各個(gè)業(yè)務(wù)上同時(shí)鋪開數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用。
在確定開發(fā)目標(biāo)和范圍以后,應(yīng)該編制需求文檔,作為今后開發(fā)數(shù)據(jù)倉(cāng)庫(kù)的依據(jù)。 數(shù)據(jù)倉(cāng)庫(kù)開發(fā)的首要目標(biāo)是確定所需要信息的范圍,確定用戶提供決策幫助時(shí),在主題和指標(biāo)域需要哪些數(shù)據(jù)源。這就需要定義:用戶需要什么數(shù)據(jù)?面向主題的數(shù)據(jù)倉(cāng)庫(kù)需要什么樣的支持?jǐn)?shù)據(jù)?為成功地向用戶提交數(shù)據(jù),開發(fā)人員需要哪些商業(yè)知識(shí)?哪些背景知識(shí)?這就需要定義整體需求,以文件的形式整理現(xiàn)存的記錄系統(tǒng)和系統(tǒng)環(huán)境,對(duì)使用數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的候選應(yīng)用系統(tǒng)進(jìn)行標(biāo)識(shí)、排序,構(gòu)造一個(gè)傳遞模型,確定尺度、事實(shí)及時(shí)間標(biāo)記算法,以便從系統(tǒng)中抽取信息且將他們放入數(shù)據(jù)倉(cāng)庫(kù)。通過信息范圍確定可為開發(fā)人員提供一個(gè)良好的分析平臺(tái),和用戶一起分析哪些信息是數(shù)據(jù)倉(cāng)庫(kù)需要的,進(jìn)行商業(yè)活動(dòng)需要什么數(shù)據(jù)。開發(fā)人員可以和用戶進(jìn)一步定義需要,例如數(shù)據(jù)分級(jí)層次、聚合的層次、加載的頻率以及需要保持的時(shí)間表等。 數(shù)據(jù)倉(cāng)庫(kù)開發(fā)的另一個(gè)重要目標(biāo)是確定利用哪些方法和工具訪問和導(dǎo)航數(shù)據(jù)?雖然用戶都需要存取并且檢索數(shù)據(jù)倉(cāng)庫(kù)的內(nèi)容,但是所存取的粒度有所不同,有的可能是詳細(xì)的記錄,有的可能是比較概括的記錄或十分概括的記錄。用戶要求的數(shù)據(jù)概括程度不同,將導(dǎo)致數(shù)據(jù)倉(cāng)庫(kù)的聚集和概括工具的需求不同。
數(shù)據(jù)倉(cāng)庫(kù)還有具有一定功能來訪問和檢索圖表、預(yù)定義的報(bào)表、多維數(shù)據(jù)、概括性數(shù)據(jù)和詳細(xì)記錄。用戶從數(shù)據(jù)倉(cāng)庫(kù)中獲得信息,應(yīng)該有電子表格、統(tǒng)計(jì)分析器和支持多維分析的分析處理器等工具的支持,以解釋和分析數(shù)據(jù)倉(cāng)庫(kù)中的內(nèi)容,產(chǎn)生并且驗(yàn)證不同的市場(chǎng)假設(shè)、建議和決策方案。為將決策建議和各種決策方案向用戶清楚地表達(dá)出來,需要利用報(bào)表、圖表和圖像等強(qiáng)有力的信息表達(dá)工具。 數(shù)據(jù)倉(cāng)庫(kù)開發(fā)的其他目標(biāo),是確定數(shù)據(jù)倉(cāng)庫(kù)內(nèi)部數(shù)據(jù)的規(guī)模。在數(shù)據(jù)倉(cāng)庫(kù)中不僅包含當(dāng)前數(shù)據(jù),而且包含多年的歷史數(shù)據(jù)。數(shù)據(jù)的概括程度決定了這些數(shù)據(jù)壓縮和概括的最大限度。如果要讓數(shù)據(jù)倉(cāng)庫(kù)提供對(duì)歷史記錄進(jìn)行決策查詢的功能,就必須支持對(duì)大量數(shù)據(jù)的管理。數(shù)據(jù)的規(guī)模不僅直接影響決策查詢的時(shí)間,而且還將直接影響企業(yè)決策的質(zhì)量。
在數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)目標(biāo)中,還有:根據(jù)用戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)的基本需求,確定數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的含義;確定數(shù)據(jù)倉(cāng)庫(kù)內(nèi)容的質(zhì)量,以確定使用、分析和建議的可信級(jí)別;哪種類型的數(shù)據(jù)倉(cāng)庫(kù)可以滿足最終用戶的需求,這些數(shù)據(jù)倉(cāng)庫(kù)應(yīng)該具有怎樣的功能;需要哪些元數(shù)據(jù),如何使用數(shù)據(jù)源中的數(shù)據(jù)等。 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)目標(biāo)多種多樣,十分復(fù)雜,需要開發(fā)人員和用戶在開發(fā)與使用的過程中不斷交互完善。因此,在規(guī)劃中需要確定數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)范圍。使開發(fā)人員能夠根據(jù)需求和目標(biāo)的重要性逐步進(jìn)行,并且在開發(fā)中吸取經(jīng)驗(yàn)教訓(xùn),為數(shù)據(jù)倉(cāng)庫(kù)在企業(yè)中的全部實(shí)現(xiàn)提供技術(shù)準(zhǔn)備。因此,在為數(shù)據(jù)倉(cāng)庫(kù)確定總體開發(fā)方向和目標(biāo)以后,就必須確定一個(gè)有限的能夠很快體現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)效益的使用范圍。在考慮數(shù)據(jù)倉(cāng)庫(kù)苦的應(yīng)用范圍時(shí),主要從使用部門的數(shù)量和類型、數(shù)據(jù)源的數(shù)量、企業(yè)模型的子集、預(yù)算分配以及開發(fā)項(xiàng)目所需的時(shí)間等角度分析。
在分析這些因素時(shí),可從用戶的角度和技術(shù)的角度兩方面進(jìn)行。 從用戶的角度應(yīng)該分析哪些部門最先使用數(shù)據(jù)倉(cāng)庫(kù)?是哪些人員為了什么目的使用數(shù)據(jù)倉(cāng)庫(kù)?以及數(shù)據(jù)倉(cāng)庫(kù)首先要滿足哪些決策查詢?因?yàn)檫@些決策查詢往往確定了關(guān)于數(shù)據(jù)維數(shù)、報(bào)表的種類,這些因素都將確定數(shù)據(jù)倉(cāng)庫(kù)定義時(shí)所需要的數(shù)量關(guān)系。查詢的格式越具體,越容易提供數(shù)據(jù)倉(cāng)庫(kù)的維數(shù)、聚集和概括的規(guī)劃說明。 從技術(shù)角度分析,應(yīng)該確定數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)庫(kù)的規(guī)模,數(shù)據(jù)倉(cāng)庫(kù)的元數(shù)據(jù)庫(kù)是存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)定義的模型。數(shù)據(jù)定義存儲(chǔ)在倉(cāng)庫(kù)管理器的目錄中,可以作為所有查詢和報(bào)表工具構(gòu)造和查詢數(shù)據(jù)倉(cāng)庫(kù)的依據(jù)。元數(shù)據(jù)庫(kù)的規(guī)模直接表示了數(shù)據(jù)倉(cāng)庫(kù)中必須管理的數(shù)據(jù)規(guī)模。通過對(duì)元數(shù)據(jù)庫(kù)規(guī)模的管理,實(shí)際上就確定了數(shù)據(jù)倉(cāng)庫(kù)中所需要管理的數(shù)據(jù)規(guī)模。
3、數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)選擇
數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)可以進(jìn)行靈活的選擇,可將組織所使用的各種平臺(tái)進(jìn)行恰當(dāng)?shù)姆指?,把?shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)和最終用戶使用的工作站分割開來進(jìn)行恰當(dāng)?shù)脑O(shè)計(jì)。
(1)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用結(jié)構(gòu)
基于業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù) 在這種結(jié)構(gòu)中,將運(yùn)作的數(shù)據(jù)用于無需修改數(shù)據(jù)的只讀應(yīng)用程序中。具有這種結(jié)構(gòu)的數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)庫(kù)是一種虛庫(kù),而不是數(shù)據(jù)倉(cāng)庫(kù)自身的元數(shù)據(jù)。在數(shù)據(jù)倉(cāng)庫(kù)元數(shù)據(jù)庫(kù)的直接指導(dǎo)下,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的查詢就是簡(jiǎn)單的從數(shù)據(jù)庫(kù)中抽取數(shù)據(jù)。
利用在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)源凈化、集成、概括和集成等操作,將數(shù)據(jù)源從業(yè)務(wù)處理系統(tǒng)中傳輸進(jìn)集中的數(shù)據(jù)倉(cāng)庫(kù),各部門的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用只在數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行。這種結(jié)構(gòu)經(jīng)常發(fā)生在多部門、少用戶使用數(shù)據(jù)倉(cāng)庫(kù)的情況下。這里的集中僅僅是邏輯上的,物理上可能是分散的。
數(shù)據(jù)集市是指在部門中使用的數(shù)據(jù)倉(cāng)庫(kù),因?yàn)槠髽I(yè)中的各個(gè)職能部門都有自己的特殊需要,而統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù)可能不能滿足這些部門的特殊要求。這種體系結(jié)構(gòu)經(jīng)常發(fā)生在個(gè)別部門對(duì)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用感興趣,而組織中其他部門卻對(duì)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用十分冷漠之時(shí),由熱心的部門單獨(dú)開發(fā)式所采用。
數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市
企業(yè)各部門擁有滿足自己需要的數(shù)據(jù)集市,其數(shù)據(jù)從企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中獲取,而數(shù)據(jù)倉(cāng)庫(kù)從企業(yè)各種數(shù)據(jù)源中收集和分配。這種體系結(jié)構(gòu)是一種較為完善的數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu),往往發(fā)生在組織整體對(duì)數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用感興趣之時(shí)所采用的體系結(jié)構(gòu)。
(2)數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)平臺(tái)結(jié)構(gòu) 單層結(jié)構(gòu)
單層結(jié)構(gòu)主要是在數(shù)據(jù)源和數(shù)據(jù)倉(cāng)庫(kù)之間共享平臺(tái),或者讓數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市與最終用戶工作站使用同一個(gè)平臺(tái)。共享一個(gè)平臺(tái)可以降低數(shù)據(jù)抽取和數(shù)據(jù)轉(zhuǎn)換的復(fù)雜性,但是共享平臺(tái)在應(yīng)用中可能遇到性能和管理方面的問題,這種體系結(jié)構(gòu)一般在數(shù)據(jù)倉(cāng)庫(kù)規(guī)模較小,而組織的業(yè)務(wù)系統(tǒng)平臺(tái)具有較大潛力之時(shí)所采用。
客戶/服務(wù)器兩層結(jié)構(gòu)
一層為客戶機(jī),一層為服務(wù)器,最終用戶訪問工具在客戶層上運(yùn)行,而數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市位于服務(wù)器上,該技術(shù)機(jī)構(gòu)一般用于普通規(guī)模的數(shù)據(jù)倉(cāng)庫(kù)。
三層客戶/服務(wù)器結(jié)構(gòu)
基于工作站的客戶層、基于服務(wù)器的中間層和基于主機(jī)的第三層。主機(jī)層負(fù)責(zé)管理數(shù)據(jù)源和可選的源數(shù)據(jù)轉(zhuǎn)換;服務(wù)器運(yùn)行數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市軟件,并且存儲(chǔ)倉(cāng)庫(kù)的數(shù)據(jù);客戶工作站運(yùn)行查詢和報(bào)表運(yùn)用程序,且還可以存儲(chǔ)從數(shù)據(jù)集市或數(shù)據(jù)倉(cāng)庫(kù)卸載的局部數(shù)據(jù)。在數(shù)據(jù)倉(cāng)庫(kù)稍具規(guī)模,兩層數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)已經(jīng)不能滿足客戶的需求,要講數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)管理、數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用處理和客戶端應(yīng)用分開之時(shí),可以采用這種結(jié)構(gòu)。
多層式結(jié)構(gòu)
這是在三層機(jī)構(gòu)基礎(chǔ)上發(fā)展起來的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu),在該結(jié)構(gòu)中從最內(nèi)數(shù)據(jù)層到最外層的客戶層依次是:?jiǎn)为?dú)的數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)層、對(duì)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市進(jìn)行管理的數(shù)據(jù)倉(cāng)庫(kù)服務(wù)層、進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)查詢處理的查詢服務(wù)層、完成數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用處理的應(yīng)用服務(wù)層和面向最終用戶的客戶層。體系層次可能多達(dá)五層,這種體系結(jié)構(gòu)一般用于超規(guī)模數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。
4、數(shù)據(jù)倉(cāng)庫(kù)使用方案和項(xiàng)目規(guī)劃預(yù)算
數(shù)據(jù)倉(cāng)庫(kù)的實(shí)際使用方案與開發(fā)預(yù)算,是數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃中最后需要確定的問題。因?yàn)?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉(cāng)庫(kù)主要用于對(duì)企業(yè)管理人員的決策支持,確保其實(shí)用性是十分重要的,因此需要讓最終用戶參與數(shù)據(jù)倉(cāng)庫(kù)的功能設(shè)計(jì)。這種參與是通過用戶的實(shí)際使用方案進(jìn)行的,使用方案是一個(gè)非常重要的需求模型。實(shí)際使用方案必須有助于闡明最終用戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)的要求,這些要求有的只使用適當(dāng)?shù)臄?shù)據(jù)源就可以得到基本滿足,而有的卻需要來自企業(yè)外部的數(shù)據(jù)源,這就需要通過使用方案將這些不同的要求聯(lián)系起來。 實(shí)際使用方案還可以將最終用戶的決策支持要求與數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)要求聯(lián)系起來。因?yàn)楫?dāng)用戶確定最終要求后,為元數(shù)據(jù)庫(kù)的范圍確定一個(gè)界限。還可以確定所需要的歷史信息的數(shù)量,當(dāng)根據(jù)特定的用戶進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的規(guī)劃時(shí),就可確定最終用戶所關(guān)心的維度(時(shí)間、方位、商業(yè)單位和生產(chǎn)企業(yè)),因?yàn)榫S度與所需要的概括操作有明顯的關(guān)系,必須選擇對(duì)最終用戶有實(shí)際意義的維度,如:“月”、“季度”、“年”等。最后,還可以確定數(shù)據(jù)集市/數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)需要,使設(shè)計(jì)人員確定采用單純數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu),還是單純的數(shù)據(jù)集市結(jié)構(gòu)或者是兩者相結(jié)合的結(jié)構(gòu)。
在實(shí)際使用開發(fā)方案確定后,還需要對(duì)開發(fā)方案的預(yù)算進(jìn)行估計(jì),確定項(xiàng)目的投資數(shù)額。投資方案的確定可以依據(jù)以往的軟件開發(fā)成本,但是這種預(yù)算的評(píng)估比較粗糙。另一種方法是參照結(jié)構(gòu)進(jìn)行成本評(píng)估,也就是說,將數(shù)據(jù)倉(cāng)庫(kù)實(shí)際使用方案所確定的構(gòu)件進(jìn)行分解,根據(jù)各個(gè)構(gòu)件的成本進(jìn)行預(yù)算估算。數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)件包含在數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、最終用戶存取、數(shù)據(jù)管理、元數(shù)據(jù)管理、傳輸基礎(chǔ)等部分中,這些構(gòu)件有的在企業(yè)原有信息系統(tǒng)中已經(jīng)具備,有的可以選擇商品化構(gòu)件,有的則需要自我開發(fā)。根據(jù)這些構(gòu)件的不同來源,可以確定比較準(zhǔn)確的預(yù)算。 在完成數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃后,就需要編制數(shù)據(jù)倉(cāng)庫(kù)開發(fā)說明書,說明系統(tǒng)與企業(yè)戰(zhàn)略目標(biāo)的關(guān)系,以及系統(tǒng)與企業(yè)急需處理的范圍相對(duì)有限的開發(fā)機(jī)會(huì),所設(shè)想的業(yè)務(wù)機(jī)會(huì)的說明以及目標(biāo)任務(wù)概況說明、重點(diǎn)支持的職能部門和今后工作的建議。數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目應(yīng)有明確的業(yè)務(wù)價(jià)值計(jì)劃開始,在計(jì)劃中需要闡明期望取得的有形和無形的利益。無形利益包含利用數(shù)據(jù)倉(cāng)庫(kù)使決策完成得更快更好等利益。
業(yè)務(wù)價(jià)值計(jì)劃最好由目標(biāo)業(yè)務(wù)主管來完成,因?yàn)?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉(cāng)庫(kù)是用戶驅(qū)動(dòng)的,應(yīng)該讓用戶積極參與數(shù)據(jù)倉(cāng)庫(kù)的建設(shè),在規(guī)劃書中要確定數(shù)據(jù)倉(cāng)庫(kù)開發(fā)目標(biāo)的實(shí)現(xiàn)范圍、體系結(jié)構(gòu)和使用方案及開發(fā)預(yù)算。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10