
出人意料的是,音樂人才、物理學家和工商管理人士能為大數據團隊帶來全新的視角。你的企業(yè)正在打造數據科學團隊嗎?首先,你應當從業(yè)務部門抽調專家來提出正確的問題。然后考慮招募一些物理學家、音樂人才,當然,還有統(tǒng)計人才和計算機科學家。
這些才是頂級大數據團隊的關鍵“配方”,至少管理咨詢與技術顧問公司Booz Allen的戰(zhàn)略創(chuàng)新部門副總裁喬什沙利文是這么認為的。沙利文的部門負責幫助客戶開展數據分析項目,在這個過程中沙利文看到太多企業(yè)犯下相同的錯誤。
“大多數企業(yè)只知道招聘計算機科學家,因為他們認為大數據是一個技術問題,但他們錯了,”在接受媒體采訪時,沙利文說道:
我們問客戶的第一個問題是:你準備向數據分析系統(tǒng)提出什么樣的問題?而不是你需要如何去編寫代碼。你首先需要有創(chuàng)造力和好奇的人。
Booz Allen組件數據科學團隊的第一步是確保團隊成員包括數學與統(tǒng)計人才、計算機科學專家和企業(yè)各業(yè)務領域專家。其中業(yè)務專家非常關鍵,他們是確保大數據分析產生商業(yè)價值并提升企業(yè)決策的關鍵環(huán)節(jié)。
值得注意的是,大數據團隊中的業(yè)務專家需要與業(yè)務部門進行崗位輪換,幫助企業(yè)所有業(yè)務部門都意識到大數據團隊的存在,同時需要將數據團隊中的業(yè)務專家送回到業(yè)務崗位,他們將成為數據驅動的企業(yè)經營管理方法與文化的布道者。
太多企業(yè)為特定部門或者業(yè)務線組件專門的分析團隊,這些團隊常常無法從企業(yè)的整體業(yè)務出發(fā)考慮問題,同時這也會滋長“數據保護主義”,部門間各自囤積數據,并為數據分享設置障礙。
另外一個令人質疑的做法是在研發(fā)團隊內囤積分析專家,使他們很難接觸到業(yè)務部門。
陶氏化學在這方面就做得非常好,其數據科學家團隊與業(yè)務專家肩并肩合作,開發(fā)出新的業(yè)務成本模型僅僅在貨運和原材料兩個環(huán)節(jié)就幫助公司節(jié)省了數十億美元。
在統(tǒng)計專家和計算機科學家之外,沙利文的部門還成功地將物理學家和音樂專業(yè)人士引入數據分析團隊,這聽上去有些古怪。實際上,這兩類人才為數據分析團隊帶來了全新的觀點和方法。例如物理學家?guī)砹藦牟聹y、假設到實驗的一整套科學驗證方法,而音樂專業(yè)人才則具備“驚人的創(chuàng)造力和量化技能”。
當數據分析團隊在處理多種數據的時候,非常類似交響樂作者編配多種樂器的過程,而這方面音樂人才是最在行的。例如在一個醫(yī)藥公司的數據分析項目中,需要混搭不良藥物反應數據、社交媒體數據、研究注釋、實驗室數據和分子數據。在大數據分析出現之前,從來沒有人會將這么多不同來源的數據整合到一起。事實證明,在音樂人才的幫助下,這些數據形成了完美的“合奏”,并最終幫這家藥企優(yōu)化了藥物研發(fā)的優(yōu)先級。
在最近的一個項目中,沙利文的團隊幫助一家航空公司實施的大數據項目證明了大數據的商業(yè)價值。在這個大數據項目中,旅客的行程、路線、票價、目的地、載客量歷史數據與體育賽事日程、傳統(tǒng)節(jié)日、學校假期、旅客人口統(tǒng)計和社交媒體數據整合到一起分析。
以上這些數據航空公司有很多對應的BI儀表盤和PDF報告工具,但航空公司們從來沒想到過將這些數據綜合起來分析。結果證明,這樣的大數據分析能幫助他們優(yōu)化航班時刻表和票價,每年增加數千萬美元的收入。
數據分析團隊多元化的優(yōu)勢在大數據眾包平臺Kaggle上得到最佳體現。在那里,不乏天文學家、對沖基金金融工程師、經濟學家以及數學家甚至律師提出能擊敗企業(yè)內部數據分析團隊的更好的分析方法/算法。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10