
大數據時代:數據就是一切_數據分析師培訓
互聯(lián)網世界中的人與人交互信息、位置信息,企業(yè)交易信息等數據已經遠遠超越現(xiàn)有企業(yè)的承載能力。如何盤活這些數據資產,使其為國家治理、企業(yè)決策乃至個人生活服務,是大數據發(fā)展的核心議題。
7月25日,在一場名為“踐行大數據”的大數據商業(yè)論壇上,來自大數據技術企業(yè)、電商、學界以及一些傳統(tǒng)行業(yè)的專家對大數據的現(xiàn)狀和未來發(fā)展各抒己見。
蘇萌:大數據企業(yè)受到資本市場熱捧
百分點集團創(chuàng)始人、董事長 蘇萌
作為百分點集團的創(chuàng)始人和董事長,曾經的北京大學光華管理學院副系主任、博士生導師,有著美國康奈爾大學市場營銷學博士頭銜的蘇萌,領導著國內領先的大數據技術與應用服務商企業(yè),是國內知名的大數據營銷專家。
“過去的一年里,大數據浪潮風起云涌,基于開源軟件與系統(tǒng)的全球大數據生態(tài)鏈格局已基本形成,同時也開啟了大數據時代面向企業(yè)客戶的科技公司的新篇章??v觀全球大數據生態(tài)系統(tǒng),底層是開源框架、開源數據庫和開源計算軟件和系統(tǒng),在開源的底層基礎上,在四大領域分別涌現(xiàn)出了一些優(yōu)秀的新興公司。這四個領域包括大數據基礎技術、大數據分析、大數據應用、以及數據市場。這些公司憑借在大數據領域的技術和應用創(chuàng)新,迅猛發(fā)展,同時也受到資本市場的熱捧。”蘇萌說。
他舉例,今年3月,創(chuàng)立于2008年的硅谷大數據軟件創(chuàng)業(yè)公司Cloudera獲得英特爾資本7.4億美元的注資,估值41億美元。今年7月,專注于可用性與數據安全優(yōu)化的MapR獲得了由谷歌資本領投的1.1億美元D輪融資。這兩家大數據創(chuàng)業(yè)公司都是圍繞開源Hadoop技術建立起了自身業(yè)務,以2B技術服務的模式幫助其他公司對大數據進行分析與應用。在大數據分析領域,創(chuàng)立于2004年的情報分析公司Palantir已估值80億美元,它的優(yōu)勢在于能夠整合不同類型不同來源的海量數據,通過建模為反恐和財務事故等問題做出預警,美國的CIA和FBI都已成為它最忠實的客戶。
此外,在應用領域,廣告、營銷、金融、教育等行業(yè)的大數據應用已遍地開花,其中DMP及廣告定向數據公司eXelate通過大數據建模讓DSP和廣告商更深入地了解受眾屬性,也完成了總額超過3000萬美元的三輪融資。在金融大數據應用領域,由前谷歌首席信息官創(chuàng)立的ZestFinance通過非金融數據結合機器學習和建模對個人進行信用風險評估,解決銀行信用貸款等問題。第四個領域是數據市場和數據源,Bluekai作為代表性企業(yè),是DataExchange和DMP的開拓者,今年2月被Oracle公司以4億美元收購。Bluekai的優(yōu)勢在于提供一個數據管理平臺,即DMP,幫助企業(yè)進行媒體和受眾分析,同時建立數據交換中心,通過使用第三方數據來創(chuàng)建新的可擴展受眾。百分點在基礎技術、分析和應用三個領域均有所實踐和探索。
通過產業(yè)格局分析,蘇萌認為全球大數據生態(tài)系統(tǒng)未來存在六大趨勢。首先是應用化。即從投入基礎設施轉向可執(zhí)行的分析與應用的趨勢。大數據將從概念測試進入到企業(yè)生產環(huán)境,能夠迅速落地的應用將成為市場主導。其次是服務化,一切技術都將轉換為服務,大家看到了SaaS, PaaS, IaaS的崛起,未來還會看到更多。第三,云端化。一切服務皆為云,在可預見的未來,所有企業(yè)數據和分析最終都會轉移到云端。
除了這三個趨勢,他認為,第四個趨勢是整體化,大數據整體解決方案包括數據的獲取、存儲、整合、分析、可視化。第五個趨勢是實用化,大數據分析包括從低到高的四個層次:描述性分析(發(fā)生了什么)、診斷性分析(為什么發(fā)生)、預測性分析(將會發(fā)生什么)、和建議性分析(該如何做)。最后一個趨勢是低成本化。去年阿里系掀起了“去IOE”運動,阿里云的架構已不再采用IBM的小型機、Oracle的數據庫、EMC的存儲設備,但大多數企業(yè)不具有阿里的技術能力,這些企業(yè)需要2B技術服務企業(yè)的幫助來降低“去IOE”的技術和成本門檻。
“未來,誰能幫助數以千萬計的廣大企業(yè)級用戶應用大數據技術,誰將有機會取代Oracle成為大數據時代2B領域的BAT?!碧K萌認為。
陳宇新:大數據時代我們要有“數商”
上海紐約大學商學院副院長 陳宇新
“在這個大數據的時代,成功的背后靈魂是什么?這個靈魂就是我想講的“數商”。這個‘商’不是商人的‘商’,而是‘智商’的‘商”,在大數據實在我們要有智商、情商,還要有數商?!鄙虾<~約大學杰出全球商學講席教授及上海紐約大學商學院副院長陳宇新這樣認為。
他認為,數據思維有四個緯度:一是定量思維,就是說“一切皆可測”,所有的東西都要想著把它轉化成數據測量出來。比如說一些大數據的項目試圖把那些情感性的要素測量出來,測量優(yōu)雅,或者是測量浪漫,這都是大數據技術要做到的?!安灰胫挥袑崒嵲谠诘臇|西能測量,虛擬的不能測量,其實都是可以測量的,顧客的行為都可以表達出來”。
陳宇新認為,數據四維的第二個緯度是跨界思維,就是“一切或可聯(lián)”,看似不相關的數據和行為,或許可以互相連起來,為預測和推薦,達到一個更好的效果。三是操作思維,就是一切要可行,就是要盡快到達實時的、低成本的實現(xiàn)。四是實驗思維,要允許創(chuàng)新,允許實驗,允許試錯,而且通過實驗來得出一個正確的或者是優(yōu)化的解決方案。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10