
你還在為弄不懂Hive、Spark、Pig這些編程語言而抓耳撓腮嗎?別擔心,一場競爭正讓像Hadoop這種復雜的大數(shù)據(jù)技術能更容易被非專業(yè)用戶使用,你還能享受它讓你發(fā)家致富的額外好處。
對,就是你。
幾年前,Cowen&Co.的前分析師PeterGoldmacher在一份調查簡報中表示,畢竟,你越靠近大數(shù)據(jù)技術的最終用戶,你 的回報就越大。他認為,在大數(shù)據(jù)的世界,最大的贏家并不是這項技術的供應商,而是那些會用它來創(chuàng)造全新的產業(yè)或者瓦解傳統(tǒng)業(yè)務的公司。
隨著時間一天天推移,Goldmacher在2012年做出的預測顯得越來越正確。大數(shù)據(jù)基礎的建造者應該得到贊揚,但從中獲利最多的是那些與技術營銷和銷售專家關系最密切的公司,而這些人可能都不知道怎么從一張數(shù)據(jù)透視表中進行并行運算。
提供解決方法而不是技術
我們已經在一些公司身上見過這種做法,比如JohnDeere,它們運用Hadoop和NoSQL數(shù)據(jù)庫技術開發(fā)了非常強大的以數(shù)據(jù)為導向的應用。當硅谷還把自己當做宇宙的中心時,外面那個更廣闊的世界正把大數(shù)據(jù)用在最有用的地方。
如果不是這樣我們才會感到驚訝。正如Goldmacher寫的,這一點總是適用于科學技術:正如之前所說,如果我們回顧企業(yè)資源計劃的歷史,超過兩 百家公司被創(chuàng)立,在標準商業(yè)流程的自動化過程中積累資本。這意味著1990年的投資者只有不到0.5%的可能性選擇SAP或者ORCL作為最終贏家。但 是,如果投資者在1990年購買了Dow旗下三十家開展了企業(yè)資源計劃的公司的股票,那他就能減少35%的一般成本和管理成本,并通過大規(guī)模自動化生產將 收益提高五倍,市值也將增加將近八倍。
當然,大數(shù)據(jù)基礎框架服務提供商也會大撈一把,比如Cloudera。Cloudera的市值已經達到幾十億美元,其它一些公司,像DataStax和MongoDB之類,市值也已經超過了十億美元。
但是從這些公司的軟件中獲益最多的并不是它們自己,理由如下:
大多數(shù)大數(shù)據(jù)技術是開放性資源,這意味著大家都能采用它,很難從中盈利。
這些技術主要的用戶是像Hadoop這種發(fā)展中的公司,這些公司對推動技術的采用非常重要,但是它們不愿意花錢。
與消費者關系更密切的公司和資金相對充足的公司更可能用大數(shù)據(jù)盈利。
根據(jù)第一點理由,Cloudera的合伙創(chuàng)始人MikeOlson認為,你不可能靠封閉資源平臺獲得成功,你也不能僅憑開放的資源建立一個成功 的獨立的公司。這使得供應商把所有權和開放資源許可結合起來,從而使收益最大化,但是那些處在行業(yè)頂端的公司就不用擔心這種情況。
贏家是
顯而易見,他們就是應用(具體服務)供應商,他們不向最終用戶展示技術的復雜性,只為他們所提供的服務收費。Workday的合伙創(chuàng)始人AneelBhusri幾年前就有了這個想法。
McKinsey&Co.詳細說明了大數(shù)據(jù)對不同產業(yè)的影響:
這些公司包括我前面前面提到的JohnDeeres,但論起技術上更主流,誰會勝利呢?
答案就是那些最會隱藏產品的復雜性、能讓用戶輕松操作的公司。
舉個例子,微軟就符合這種模式??纯此麑zure的機器學習做了什么。Azure機器學習有望消除幾乎全部首創(chuàng)費用中與制作、開發(fā)和擴展機器學習方法有關的部分,并且可視工作流程和首創(chuàng)模板可以讓一般的機器學習任務更簡單。
雖然微軟有很多可挑剔的地方(我就經常找它的茬),但它在減少復雜計算中的困難這一方面做的比其他任何公司都多。Windows、VisualStudio,還有很多其他的科技使得主流系統(tǒng)管理員和開發(fā)者發(fā)揮創(chuàng)造性成為可能,Azure機器學習效仿了這些科技。
極客消失了!
但是,我們要進一步考慮。畢竟,雖然大數(shù)據(jù)給開發(fā)者和系統(tǒng)管理員用已經不錯了,但真正要解決的問題是這樣讓大數(shù)據(jù)更容易為你我這樣的普通人使用,Wikibon分析師DaveVellante有了下面這個想法:
商業(yè)智能造就了一類分析師,但它始終沒有成為主流。我們希望大數(shù)據(jù)能成為主流。
有一個看起來很適合做這件事的公司就是Adobe。一直以來Adobe都很關注創(chuàng)造性的職業(yè),幾年前對Omniture的收購使得Adobe穩(wěn)步跨越進了大數(shù)據(jù)世界,但它更關注幫助營銷專家獲得潛在顧客。
管理大數(shù)據(jù)的重點不在于巨大的數(shù)據(jù)量,更多的是關于不斷增加的數(shù)據(jù)來源和數(shù)據(jù)類型。對一個像Adobe這樣的公司來說,為了讓營銷專家根據(jù)廣告、圖表等內容在極短時間內做出決策,它要搜集和分析來自社會媒體、現(xiàn)金收據(jù)等等的各種信息來了解顧客的行為。
該清除雜草了
微軟和Adobe僅僅是大數(shù)據(jù)可能的贏家的兩個例子,當然還有很多其他公司可能脫穎而出,希望這里面的有你的公司。
為了達成這個目標,我們需要停止對大數(shù)據(jù)技術中沒什么用的東西的鉆研,轉而去關注它們能創(chuàng)造的商業(yè)價值。這種價值能通過我們使用的應用傳遞,不會憑空消失。
Olson在接受博世的DirkSlama的采訪時說,他和很多僅僅把大數(shù)據(jù)當做數(shù)據(jù)的人聊過,他覺得這些人不是理想的工作伙伴,因為他們從根本上來說不是以商業(yè)問題為導向的。大數(shù)據(jù)時代真正的贏家是那些專注于解決實際商業(yè)問題的人。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到決策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10