【結(jié)構(gòu)化數(shù)據(jù)及高級(jí)編輯查詢】
1、結(jié)構(gòu)化數(shù)據(jù)—列表List{ }
說明:列表有序號(hào)可檢索,序號(hào)從0開始,書寫格式:{123,true,"A"}
2、結(jié)構(gòu)化數(shù)據(jù)—記錄Record[ ]
說明:字段名+字段值,字段名可不用引號(hào),也可以#加"",書寫格式:
3、結(jié)構(gòu)化數(shù)據(jù)—表Table( )
說明:用#table建表,定義列名可用列表或記錄,隱式或顯示方式定義字段的數(shù)據(jù)類型。書寫格式:
4、應(yīng)用一
用高級(jí)編輯器語言編寫如下所示的表格結(jié)構(gòu)和記錄。
5、應(yīng)用二
編寫獲取網(wǎng)站數(shù)據(jù)的查詢,從空氣知音網(wǎng)站爬取各省市的空氣質(zhì)量數(shù)據(jù)。網(wǎng)址格式:http://www.air-level.com/air/+城市名拼音,城市名為文本變量。
【Power Pivot 搭建多維數(shù)據(jù)模型】
1、表的對應(yīng)關(guān)系
一對一:主鍵對主鍵,在業(yè)務(wù)工作中幾乎見不到
多對多:非主鍵對非主鍵,可以遇到但是不能使用,因?yàn)槟苓B接但沒法正確進(jìn)行分類匯總
一對多:主鍵對非主鍵,連接時(shí)應(yīng)該使用的連接關(guān)系,多表出度量(連續(xù)型變量),一表出維度
注:維度篩選度量,篩選是維度匯總度量的能力。
2、變量類型(數(shù)據(jù)類型)......是否為主鍵:
名義型(文本),如ID、姓名、星座、血型等,用于維度,可為主鍵
有序型(文本):成績水平、員工績效、健康狀況,用于維度,不能為主鍵
連續(xù)型(數(shù)值):溫度、身高、體重,用于度量,不能為主鍵
3、多維數(shù)據(jù)集間的關(guān)系
表間關(guān)系永遠(yuǎn)是一表指向多表,一表出維度+多表出度量確定透視表的結(jié)構(gòu)。
下圖是Power Pivot中建立表關(guān)系的ER圖,其中1是一表,箭頭永遠(yuǎn)指向多表,表與表之間可以建立單向、雙向連接。
4、建立數(shù)據(jù)模型的邏輯——交叉篩選器和鏈接規(guī)則
單向連接下:一表出維度多表出度量(T1)
雙向連接下:一表出維度多表出度量(T1),多表出度量一表出維度(T2)
- T1連接關(guān)系:維度對度量的合并同類項(xiàng)計(jì)算
- T2連接關(guān)系:維度下對應(yīng)連接用關(guān)鍵字不同情況對度量的合并同類項(xiàng)
5、T2鏈接關(guān)系可能出現(xiàn)的場景:
(1) 如下圖,相鄰的兩表雙向連接時(shí),多表出維度,一表出度量,這種情況要避免。
(2) 如下圖,跨表篩選——通過關(guān)鍵字進(jìn)行跨表連接,要盡量避免;當(dāng)滿足維度與關(guān)鍵字是父子級(jí)關(guān)系的時(shí)候,T2才會(huì)和T1得到相同結(jié)果。
注:一個(gè)父級(jí)值對應(yīng)多個(gè)子級(jí)值,一個(gè)子級(jí)值只能屬于一個(gè)父級(jí)值,如省份與城市、產(chǎn)品系列和產(chǎn)品。





