
作者 | CDA數(shù)據(jù)分析師
Tableau內(nèi)置的連接器可以連接到所有常用的數(shù)據(jù)源。
數(shù)據(jù)連接器
目前可以連接70多種數(shù)據(jù)源,分為本地連接和服務(wù)器連接。 Tableau支持的本地連接包括Excel、txt、csv、json等各類(lèi)常見(jiàn)的源數(shù)據(jù)格式,還支持多種空間文件, 為使用地圖分析提供了條件。
Tableau支持的服務(wù)連接包括各類(lèi)數(shù)據(jù)庫(kù)(如Mysql、Oracle、MongoDB)、在線數(shù)據(jù)服務(wù)(如google analtics)等,可以根據(jù)使用需要,與目標(biāo)服務(wù)器建立連接關(guān)系。
如果以上提供的連接不滿足您的需求,可以選擇使用“其他數(shù)據(jù)庫(kù) (ODBC)”或“Web 數(shù)據(jù)連接器”創(chuàng)建自己的連接。
設(shè)置數(shù)據(jù)源
Tableau數(shù)據(jù)源是數(shù)據(jù)與Tableau之間的鏈接,本質(zhì)上是數(shù)據(jù)、連接信息以及基于數(shù)據(jù)進(jìn)行的自定義操作的總和。
數(shù)據(jù)源包含:
本地文件連接
打開(kāi)Tableau Desktop進(jìn)入數(shù)據(jù)連接界面,在連接到文件中選擇要連接的文件類(lèi)型。這里以Excel文件為例,單擊“Microsoft Excel”在彈出的“打開(kāi)”對(duì)話框中找到想要連接的文件。
雙擊或拖動(dòng)表名至畫(huà)布區(qū),下方會(huì)顯示數(shù)據(jù)預(yù)覽。
數(shù)據(jù)庫(kù)連接
在數(shù)據(jù)連接界面,連接到服務(wù)器中選擇要連接的服務(wù)器。這里以“MySQL”為例,單擊“MySQL”在彈出“MySQL”對(duì)話框輸入服務(wù)器IP、端口號(hào)、用戶名及密碼即可登錄到MySQL服務(wù)器。
建立連接后,在數(shù)據(jù)庫(kù)列表中選擇要連接的數(shù)據(jù)庫(kù),下方會(huì)顯示當(dāng)前數(shù)據(jù)庫(kù)下可用的工作表。雙擊或拖動(dòng)表名至畫(huà)布區(qū),下方會(huì)顯示數(shù)據(jù)預(yù)覽。
也可以雙擊或拖動(dòng)“新自定義SQL”至畫(huà)布區(qū),輸入SELECT語(yǔ)句以連接想要的數(shù)據(jù)。
剪貼板粘貼
組合數(shù)據(jù)源
在一個(gè)工作簿中可以同時(shí)創(chuàng)建不同的數(shù)據(jù)連接。
數(shù)據(jù)聯(lián)結(jié)
當(dāng)需要從多個(gè)數(shù)據(jù)表中獲取數(shù)據(jù)時(shí),則要用到數(shù)據(jù)聯(lián)接操作。這里以兩表聯(lián)結(jié)為例,以兩個(gè)表的共有字段作為關(guān)鍵字段來(lái)建立聯(lián)結(jié)關(guān)系。 為了簡(jiǎn)單直觀的操作演示,本文使用自制的Excel數(shù)據(jù)集demo,文件中包含table1和table2兩個(gè)數(shù)據(jù)表。
聯(lián)結(jié)方式
Tableau中支持四種聯(lián)結(jié)方式:內(nèi)聯(lián)接、左聯(lián)接、右聯(lián)接和完全外部聯(lián)接。通常情況,Tableau會(huì)自動(dòng)判斷兩張表的關(guān)鍵字段并進(jìn)行關(guān)聯(lián),如果關(guān)聯(lián)不正確或關(guān)鍵字段不一致無(wú)法自動(dòng)關(guān)聯(lián),可以手動(dòng)進(jìn)行關(guān)聯(lián)。
數(shù)據(jù)合并
當(dāng)需要將有多個(gè)結(jié)構(gòu)一致的數(shù)據(jù)表整合匯總在一起時(shí),則可以使用數(shù)據(jù)合并。數(shù)據(jù)聯(lián)接是橫向擴(kuò)展,數(shù)據(jù)合并是縱向增加。 進(jìn)行數(shù)據(jù)合并的要求是,每個(gè)數(shù)據(jù)表的==字段名、個(gè)數(shù)、順序和數(shù)據(jù)類(lèi)型必須完全一致==。 為了簡(jiǎn)單直觀的操作演示,本文使用自制的Excel數(shù)據(jù)集demo,文件中包含三個(gè)數(shù)據(jù)表。
手動(dòng)數(shù)據(jù)合并
雙擊或拖放“新建并集”至畫(huà)布區(qū),將需要合并的數(shù)據(jù)表拖入彈出的并集(手動(dòng))對(duì)話框。
合并后的數(shù)據(jù)表包含三個(gè)數(shù)據(jù)表的所有數(shù)據(jù),并且各字段一一對(duì)應(yīng)。需要注意的是,新增了sheet和table name兩個(gè)字段,用于說(shuō)明并集中的值的來(lái)源。
自動(dòng)數(shù)據(jù)合并
雙擊或拖放“新建并集”至畫(huà)布區(qū),在彈出的“并集”對(duì)話框中選擇“通配符(自動(dòng))”。 在“工作表”位置,將匹配內(nèi)容改寫(xiě)為“班”,其中“班”是共有的名稱,是通配符,用于匹配三個(gè)工作表。
合并后的數(shù)據(jù)表包含三個(gè)數(shù)據(jù)表的所有數(shù)據(jù),并且各字段一一對(duì)應(yīng)。需要注意的是,新增了path、sheet兩個(gè)字段,用于說(shuō)明并集中的值的來(lái)源路徑及表名稱。
數(shù)據(jù)連接方式
與數(shù)據(jù)源完成連接后,將數(shù)據(jù)表拖放至畫(huà)布區(qū),就可以在畫(huà)布區(qū)看到“連接”方式的選擇,分別是“實(shí)時(shí)”和“數(shù)據(jù)提取”。 實(shí)時(shí):直接從數(shù)據(jù)源實(shí)時(shí)查詢獲取數(shù)據(jù)信息,Tableau不對(duì)源數(shù)據(jù)進(jìn)行存儲(chǔ)。 數(shù)據(jù)提取:將數(shù)據(jù)源的數(shù)據(jù)保存到本地計(jì)算機(jī),大幅縮短Tableau查詢載入源數(shù)據(jù)的時(shí)間。
為什么有兩種連接方式
數(shù)據(jù)提取
數(shù)據(jù)提取是保存的數(shù)據(jù)子集。 在創(chuàng)建數(shù)據(jù)的數(shù)據(jù)提取時(shí),可以通過(guò)使用篩選器和配置其他限制來(lái)減少數(shù)據(jù)總數(shù)。 創(chuàng)建數(shù)據(jù)提取后,可使用原始數(shù)據(jù)中的數(shù)據(jù)對(duì)其進(jìn)行刷新。在刷新數(shù)據(jù)時(shí),可以選擇進(jìn)行完全刷新或增量刷新。 完全刷新:默認(rèn)方式,每次都會(huì)重新獲取數(shù)據(jù)源的數(shù)據(jù),創(chuàng)建的本地副本與數(shù)據(jù)源一致。 增量刷新:僅刷新自上次數(shù)據(jù)提取后新增的行。
數(shù)據(jù)提取的優(yōu)勢(shì)
創(chuàng)建數(shù)據(jù)提取
選擇數(shù)據(jù)提取后,會(huì)顯示“編輯”和“刷新”按鈕。單擊“編輯”在彈出的“數(shù)據(jù)提取”對(duì)話框中設(shè)置數(shù)據(jù)提取的要求。
指定在數(shù)據(jù)提取中存儲(chǔ)數(shù)據(jù)的方式
PS:“單個(gè)表”和“多個(gè)表”選項(xiàng)只會(huì)影響數(shù)據(jù)提取中數(shù)據(jù)的存儲(chǔ)方式,不影響數(shù)據(jù)提取中的表在“數(shù)據(jù)源”頁(yè)面上的顯示方式。 假設(shè)您的數(shù)據(jù)提取由三個(gè)表組成。如果直接打開(kāi)配置為使用默認(rèn)選項(xiàng)“單個(gè)表”的數(shù)據(jù)提取 (.hyper) 文件,在“數(shù)據(jù)源”頁(yè)面上只會(huì)顯示一個(gè)表。但是,如果打開(kāi)使用打包數(shù)據(jù)源 (.tdsx) 文件的數(shù)據(jù)提取或包含其對(duì)應(yīng)數(shù)據(jù)提取 (.hyper) 文件的數(shù)據(jù)源 (.tdsx) 文件,在“數(shù)據(jù)源”頁(yè)面上可以看到包含數(shù)據(jù)提取的全部三個(gè)表。
指定要提取的數(shù)據(jù)量
設(shè)置完成后,單擊工作表標(biāo)簽頁(yè)可啟動(dòng)數(shù)據(jù)提取創(chuàng)建過(guò)程。在隨后顯示的對(duì)話框中,選擇一個(gè)用于保存數(shù)據(jù)提取的位置,為該數(shù)據(jù)提取文件指定名稱,然后單擊“保存”即可。
在抽樣數(shù)據(jù)與整個(gè)數(shù)據(jù)提取之間切換
當(dāng)您使用大型數(shù)據(jù)提取時(shí),您可能需要?jiǎng)?chuàng)建一個(gè)帶數(shù)據(jù)樣本的數(shù)據(jù)提取,以便每次將字段放在工作表標(biāo)簽頁(yè)中的功能區(qū)上時(shí),您都可以設(shè)置視圖,同時(shí)避免長(zhǎng)時(shí)間查詢。然后,可以在使用帶數(shù)據(jù)樣本的數(shù)據(jù)提取和使用整個(gè)數(shù)據(jù)源之間進(jìn)行切換,方法是在“數(shù)據(jù)”菜單中選擇數(shù)據(jù)源,然后選擇“使用數(shù)據(jù)提取”。
實(shí)時(shí)和數(shù)據(jù)提取的選擇
什么情況下選擇“實(shí)時(shí)”
什么情況下選擇“數(shù)據(jù)提取”
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10