
大數(shù)據(jù) 戰(zhàn)略、管理與生態(tài)_數(shù)據(jù)分析師
大數(shù)據(jù)這個(gè)話題,從西到東,從IT業(yè)內(nèi)到政府官員,已經(jīng)火了兩年,但還沒有完全一致的定義。目前業(yè)界一般認(rèn)同Gartner的描述,即:凡是具有“3V”特性的數(shù)據(jù)集,就是大數(shù)據(jù)。其一為Volume,極大的數(shù)據(jù)量;其二為Variety,極復(fù)雜的數(shù)據(jù)類型與數(shù)據(jù)來源;其三為Velocity,極高的數(shù)據(jù)產(chǎn)生、傳播,以及反應(yīng)速度。
在我看來,組織決策者要跨越大數(shù)據(jù)時(shí)代的“數(shù)據(jù)鴻溝”,就需要具備大數(shù)據(jù)戰(zhàn)略、大數(shù)據(jù)管理和大數(shù)據(jù)生態(tài)三大能力。
大數(shù)據(jù)戰(zhàn)略:視野,觀點(diǎn),價(jià)值
大數(shù)據(jù)的價(jià)值已經(jīng)為電商、快消、廣告等多個(gè)行業(yè)的案例所證明,但挖掘出大數(shù)據(jù)的價(jià)值并不容易。我認(rèn)為,企業(yè)決策者在制定大數(shù)據(jù)戰(zhàn)略時(shí),需要從Vision(視野)、View(觀點(diǎn))、Value(價(jià)值)這“新3V”入手。
第一點(diǎn)從視野講,企業(yè)CEO一定要把大數(shù)據(jù)、云計(jì)算作為企業(yè)核心戰(zhàn)略,而不能僅僅把大數(shù)據(jù)當(dāng)成是企業(yè)IT管理的一個(gè)方面。要下決心投入,無論軟件方面還是硬件設(shè)施。
第二是要有企業(yè)自己的觀點(diǎn),即收集和處理數(shù)據(jù)的策略。例如股市,大家很多時(shí)候面對同樣的數(shù)據(jù),但是對數(shù)據(jù)的處理方式是不一樣的,有些人說股市下行時(shí)候投入,有些人說股市下行時(shí)候要撤出。對同樣的數(shù)據(jù),甚至同樣的軟件,決策方式、觀點(diǎn)不一樣,處理結(jié)果就會大大不同,這個(gè)應(yīng)該成為公司決策體系的一個(gè)核心。
第三是價(jià)值,要在確定思路后,把對數(shù)據(jù)的分析,轉(zhuǎn)化為能解決實(shí)際問題的執(zhí)行,從而實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值。正如馬云最近所舉的例子,在淘寶上比基尼賣得最好的省份是哪兒?是內(nèi)蒙古和新疆,而不是人們通常會認(rèn)為的海南、廣東等沿海地區(qū)。大數(shù)據(jù)能幫助人們發(fā)現(xiàn)事物間隱藏的內(nèi)在關(guān)聯(lián),但并不意味著能直接帶來社會和商業(yè)價(jià)值。如果你是泳衣、防曬霜的生產(chǎn)商,又會制定怎樣的營銷策略呢?
大數(shù)據(jù)管理:簡易、開放、靈活
大數(shù)據(jù)戰(zhàn)略重要,但更重要的是如何執(zhí)行,也就是大數(shù)據(jù)管理問題。也可以通過三步走的方式來解決。首先是如何獲取、存儲和保護(hù)數(shù)據(jù);其二是數(shù)據(jù)豐富,即如何清洗、發(fā)現(xiàn)不同數(shù)據(jù)間的數(shù)據(jù)相關(guān)性;其三是數(shù)據(jù)洞察力,即通過分析、呈現(xiàn)與決策工具獲得洞察力,并最終通過付諸行動,產(chǎn)生價(jià)值。
微軟的大數(shù)據(jù)管理平臺,有著對大數(shù)據(jù)生命周期的全方位考慮,這也是為什么我們將Hadoop等開源架構(gòu),整合到微軟的大數(shù)據(jù)平臺里,一方面是將Hadoop作為對非關(guān)系型數(shù)據(jù)處理的補(bǔ)充;另一方面是將Hadoop作為一個(gè)服務(wù),整合到微軟的公有云與私有云平臺中。值得強(qiáng)調(diào)的是,微軟不是簡單地將Hadoop遷移到微軟的大數(shù)據(jù)平臺上,而是真正的融合,會系統(tǒng)地考慮其可用性、可靠性、安全性、部署的簡易性與靈活性,乃至對Hadoop上工具的集成與優(yōu)化。與此同時(shí),微軟也會堅(jiān)持開源的原則,將在Hadoop上做的一些研發(fā)工作回饋給社區(qū),與社區(qū)形成良性互動。
大數(shù)據(jù)生態(tài):平臺商、數(shù)據(jù)商、開發(fā)者、數(shù)據(jù)玩家
未來的大數(shù)據(jù)生態(tài),同樣會遵循最樸素的市場規(guī)則,不同角色的組織和個(gè)人,通過逐漸成熟的交換機(jī)制,各取所需——平臺商提供數(shù)據(jù)交易、數(shù)據(jù)分析的場所和基本工具。
原始數(shù)據(jù)商提供自由交易的數(shù)據(jù)集;開發(fā)者提供基于數(shù)據(jù)集的應(yīng)用和服務(wù),以及定制化的分析和呈現(xiàn)工具;數(shù)據(jù)玩家如同股民,在市場中尋找值得投資的數(shù)據(jù)集或者機(jī)構(gòu)進(jìn)行投資,獲得回報(bào);現(xiàn)在人們炒房、炒股、炒黃金,將來或許人們會炒數(shù)據(jù)。
微軟已經(jīng)通過Windows Azure上的Marketplace在進(jìn)行這樣的嘗試,目前主要針對的是商業(yè)用戶,已經(jīng)能將第三方解決方案提供商、服務(wù)提供商、模塊提供商和最終的商業(yè)用戶通過這一虛擬市場聯(lián)結(jié)在一起,可以發(fā)起自由交易。在這個(gè)基礎(chǔ)上,我們又延伸出一個(gè)數(shù)據(jù)集市,讓數(shù)據(jù)集的擁有者可以把數(shù)據(jù)發(fā)布到集市上,提供很多很細(xì)致的數(shù)據(jù)集,小到電影院座位和路況,大到國家宏觀經(jīng)濟(jì)發(fā)展數(shù)據(jù)。這就能讓開發(fā)者可以通過微軟的一些簡單易用的API或者工具,把這些數(shù)據(jù)整合到自己的環(huán)境里,開發(fā)新的應(yīng)用。
這樣的大數(shù)據(jù)生態(tài)顯然是健康、可持續(xù)的。對微軟、亞馬遜、谷歌、VMware這樣的平臺商而言,專心做好底層云計(jì)算基礎(chǔ)架構(gòu)和大數(shù)據(jù)服務(wù)平臺;對淘寶、中國移動、政府各部委這樣的數(shù)據(jù)商來說,原本只能自己用的數(shù)據(jù),在這個(gè)模式下可以產(chǎn)生更多的社會和商業(yè)價(jià)值;對Salesforce、SAP、用友、金蝶等應(yīng)用開發(fā)商來說,傳統(tǒng)的、非常困難的、非常繁瑣的數(shù)據(jù)整合,現(xiàn)在通過這樣一個(gè)集市,可以首次實(shí)現(xiàn)把不同應(yīng)用系統(tǒng)產(chǎn)生的數(shù)據(jù)整合起來,發(fā)現(xiàn)價(jià)值;對數(shù)據(jù)玩家來說,能夠有一個(gè)朝陽式的投資平臺可供選擇,且不那么容易被大機(jī)構(gòu)操縱。
當(dāng)數(shù)據(jù)公開、數(shù)據(jù)交易和大數(shù)據(jù)應(yīng)用成為自然而然的習(xí)慣時(shí),或許我們才可以說,大數(shù)據(jù)時(shí)代真的來臨了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10