
作者 | CDA數(shù)據(jù)分析師
Tableau內(nèi)置的連接器可以連接到所有常用的數(shù)據(jù)源。
數(shù)據(jù)連接器
目前可以連接70多種數(shù)據(jù)源,分為本地連接和服務(wù)器連接。 Tableau支持的本地連接包括Excel、txt、csv、json等各類常見的源數(shù)據(jù)格式,還支持多種空間文件, 為使用地圖分析提供了條件。
Tableau支持的服務(wù)連接包括各類數(shù)據(jù)庫(如Mysql、Oracle、MongoDB)、在線數(shù)據(jù)服務(wù)(如google analtics)等,可以根據(jù)使用需要,與目標(biāo)服務(wù)器建立連接關(guān)系。
如果以上提供的連接不滿足您的需求,可以選擇使用“其他數(shù)據(jù)庫 (ODBC)”或“Web 數(shù)據(jù)連接器”創(chuàng)建自己的連接。
設(shè)置數(shù)據(jù)源
Tableau數(shù)據(jù)源是數(shù)據(jù)與Tableau之間的鏈接,本質(zhì)上是數(shù)據(jù)、連接信息以及基于數(shù)據(jù)進行的自定義操作的總和。
數(shù)據(jù)源包含:
本地文件連接
打開Tableau Desktop進入數(shù)據(jù)連接界面,在連接到文件中選擇要連接的文件類型。這里以Excel文件為例,單擊“Microsoft Excel”在彈出的“打開”對話框中找到想要連接的文件。
雙擊或拖動表名至畫布區(qū),下方會顯示數(shù)據(jù)預(yù)覽。
數(shù)據(jù)庫連接
在數(shù)據(jù)連接界面,連接到服務(wù)器中選擇要連接的服務(wù)器。這里以“MySQL”為例,單擊“MySQL”在彈出“MySQL”對話框輸入服務(wù)器IP、端口號、用戶名及密碼即可登錄到MySQL服務(wù)器。
建立連接后,在數(shù)據(jù)庫列表中選擇要連接的數(shù)據(jù)庫,下方會顯示當(dāng)前數(shù)據(jù)庫下可用的工作表。雙擊或拖動表名至畫布區(qū),下方會顯示數(shù)據(jù)預(yù)覽。
也可以雙擊或拖動“新自定義SQL”至畫布區(qū),輸入SELECT語句以連接想要的數(shù)據(jù)。
剪貼板粘貼
組合數(shù)據(jù)源
在一個工作簿中可以同時創(chuàng)建不同的數(shù)據(jù)連接。
數(shù)據(jù)聯(lián)結(jié)
當(dāng)需要從多個數(shù)據(jù)表中獲取數(shù)據(jù)時,則要用到數(shù)據(jù)聯(lián)接操作。這里以兩表聯(lián)結(jié)為例,以兩個表的共有字段作為關(guān)鍵字段來建立聯(lián)結(jié)關(guān)系。 為了簡單直觀的操作演示,本文使用自制的Excel數(shù)據(jù)集demo,文件中包含table1和table2兩個數(shù)據(jù)表。
聯(lián)結(jié)方式
Tableau中支持四種聯(lián)結(jié)方式:內(nèi)聯(lián)接、左聯(lián)接、右聯(lián)接和完全外部聯(lián)接。通常情況,Tableau會自動判斷兩張表的關(guān)鍵字段并進行關(guān)聯(lián),如果關(guān)聯(lián)不正確或關(guān)鍵字段不一致無法自動關(guān)聯(lián),可以手動進行關(guān)聯(lián)。
數(shù)據(jù)合并
當(dāng)需要將有多個結(jié)構(gòu)一致的數(shù)據(jù)表整合匯總在一起時,則可以使用數(shù)據(jù)合并。數(shù)據(jù)聯(lián)接是橫向擴展,數(shù)據(jù)合并是縱向增加。 進行數(shù)據(jù)合并的要求是,每個數(shù)據(jù)表的==字段名、個數(shù)、順序和數(shù)據(jù)類型必須完全一致==。 為了簡單直觀的操作演示,本文使用自制的Excel數(shù)據(jù)集demo,文件中包含三個數(shù)據(jù)表。
手動數(shù)據(jù)合并
雙擊或拖放“新建并集”至畫布區(qū),將需要合并的數(shù)據(jù)表拖入彈出的并集(手動)對話框。
合并后的數(shù)據(jù)表包含三個數(shù)據(jù)表的所有數(shù)據(jù),并且各字段一一對應(yīng)。需要注意的是,新增了sheet和table name兩個字段,用于說明并集中的值的來源。
自動數(shù)據(jù)合并
雙擊或拖放“新建并集”至畫布區(qū),在彈出的“并集”對話框中選擇“通配符(自動)”。 在“工作表”位置,將匹配內(nèi)容改寫為“班”,其中“班”是共有的名稱,是通配符,用于匹配三個工作表。
合并后的數(shù)據(jù)表包含三個數(shù)據(jù)表的所有數(shù)據(jù),并且各字段一一對應(yīng)。需要注意的是,新增了path、sheet兩個字段,用于說明并集中的值的來源路徑及表名稱。
數(shù)據(jù)連接方式
與數(shù)據(jù)源完成連接后,將數(shù)據(jù)表拖放至畫布區(qū),就可以在畫布區(qū)看到“連接”方式的選擇,分別是“實時”和“數(shù)據(jù)提取”。 實時:直接從數(shù)據(jù)源實時查詢獲取數(shù)據(jù)信息,Tableau不對源數(shù)據(jù)進行存儲。 數(shù)據(jù)提取:將數(shù)據(jù)源的數(shù)據(jù)保存到本地計算機,大幅縮短Tableau查詢載入源數(shù)據(jù)的時間。
為什么有兩種連接方式
數(shù)據(jù)提取
數(shù)據(jù)提取是保存的數(shù)據(jù)子集。 在創(chuàng)建數(shù)據(jù)的數(shù)據(jù)提取時,可以通過使用篩選器和配置其他限制來減少數(shù)據(jù)總數(shù)。 創(chuàng)建數(shù)據(jù)提取后,可使用原始數(shù)據(jù)中的數(shù)據(jù)對其進行刷新。在刷新數(shù)據(jù)時,可以選擇進行完全刷新或增量刷新。 完全刷新:默認(rèn)方式,每次都會重新獲取數(shù)據(jù)源的數(shù)據(jù),創(chuàng)建的本地副本與數(shù)據(jù)源一致。 增量刷新:僅刷新自上次數(shù)據(jù)提取后新增的行。
數(shù)據(jù)提取的優(yōu)勢
創(chuàng)建數(shù)據(jù)提取
選擇數(shù)據(jù)提取后,會顯示“編輯”和“刷新”按鈕。單擊“編輯”在彈出的“數(shù)據(jù)提取”對話框中設(shè)置數(shù)據(jù)提取的要求。
指定在數(shù)據(jù)提取中存儲數(shù)據(jù)的方式
PS:“單個表”和“多個表”選項只會影響數(shù)據(jù)提取中數(shù)據(jù)的存儲方式,不影響數(shù)據(jù)提取中的表在“數(shù)據(jù)源”頁面上的顯示方式。 假設(shè)您的數(shù)據(jù)提取由三個表組成。如果直接打開配置為使用默認(rèn)選項“單個表”的數(shù)據(jù)提取 (.hyper) 文件,在“數(shù)據(jù)源”頁面上只會顯示一個表。但是,如果打開使用打包數(shù)據(jù)源 (.tdsx) 文件的數(shù)據(jù)提取或包含其對應(yīng)數(shù)據(jù)提取 (.hyper) 文件的數(shù)據(jù)源 (.tdsx) 文件,在“數(shù)據(jù)源”頁面上可以看到包含數(shù)據(jù)提取的全部三個表。
指定要提取的數(shù)據(jù)量
設(shè)置完成后,單擊工作表標(biāo)簽頁可啟動數(shù)據(jù)提取創(chuàng)建過程。在隨后顯示的對話框中,選擇一個用于保存數(shù)據(jù)提取的位置,為該數(shù)據(jù)提取文件指定名稱,然后單擊“保存”即可。
在抽樣數(shù)據(jù)與整個數(shù)據(jù)提取之間切換
當(dāng)您使用大型數(shù)據(jù)提取時,您可能需要創(chuàng)建一個帶數(shù)據(jù)樣本的數(shù)據(jù)提取,以便每次將字段放在工作表標(biāo)簽頁中的功能區(qū)上時,您都可以設(shè)置視圖,同時避免長時間查詢。然后,可以在使用帶數(shù)據(jù)樣本的數(shù)據(jù)提取和使用整個數(shù)據(jù)源之間進行切換,方法是在“數(shù)據(jù)”菜單中選擇數(shù)據(jù)源,然后選擇“使用數(shù)據(jù)提取”。
實時和數(shù)據(jù)提取的選擇
什么情況下選擇“實時”
什么情況下選擇“數(shù)據(jù)提取”
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03