
讓大數(shù)據(jù)成為一種基本的使用和操作能力
大數(shù)據(jù)重構消費者主權
“大數(shù)據(jù)”之“大”,不僅僅源于其體量的龐大,更表現(xiàn)在它的無處不在。數(shù)據(jù)充斥在我們生產(chǎn)生活的方方面面,從大數(shù)據(jù)分析中獲得競爭優(yōu)勢,已不再是所謂的高精尖企業(yè)或是高大上的科研項目的專利。它與勞動力、資本一樣,開始為企業(yè)提供重要的生產(chǎn)因素。
我們會有一套技術和方法,比如我們熟悉的Hadoop,這里面包括數(shù)據(jù)采集存儲,如何分析挖掘,如何產(chǎn)生一些有意義的信息或者支持等等。我們通過數(shù)據(jù)化的手段構建成數(shù)據(jù)世界,這個數(shù)據(jù)世界很好的反映或者模擬了現(xiàn)實世界。在這個數(shù)據(jù)世界之上,我們再構建自己的業(yè)務系統(tǒng),這些業(yè)務系統(tǒng)通過數(shù)據(jù)世界能了解到現(xiàn)實是怎么樣,從而變的更加智能化,
在這場數(shù)字革命的背景下,消費者的數(shù)據(jù)就是一切。對于企業(yè)來說,如何通過消費者數(shù)據(jù)化完成“以產(chǎn)品為中心”到“以客戶為中心來”的轉變,進而驅動核心產(chǎn)品的運營是最核心的事情。
作為概念,這很容易理解。然而在信息高度碎片化、信息渠道高度碎片化、和信息消費者對外部事物興趣高度碎片化的數(shù)字世界中找到對的人,并不那么容易。
信息化的五大趨勢:云大物移社
在整個信息化的方向上,百分點技術副總裁劉譯璟提到五個大的趨勢:云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、社會化跟移動化。
云是信息化未來的一大趨勢。未來所有的信息系統(tǒng)都在云上,因為我們更加關注運用而不關注這些底層的資源,和這些基礎的服務從哪里來。放到云上去。
物聯(lián)網(wǎng)技術是在數(shù)據(jù)世界跟現(xiàn)實之間的邊界。物聯(lián)網(wǎng)中的Sensor等設備將現(xiàn)實世界轉化到數(shù)據(jù)世界,把現(xiàn)實世界中各種基本的實體、行為轉化成數(shù)據(jù)來形成數(shù)據(jù)世界。
大數(shù)據(jù)是這個數(shù)據(jù)世界中的大腦。這顆大腦將大量數(shù)據(jù)進行收集加工,轉化成信息,甚至轉化成知識,最后再通過物聯(lián)網(wǎng)的技術反饋到現(xiàn)實世界中。這個過程是周而復始持續(xù)不斷的,使得大數(shù)據(jù)這顆大腦越來越了解現(xiàn)實世界,越來越智能。
整個現(xiàn)實世界和數(shù)據(jù)世界不斷的通過這幾種技術交互,大數(shù)據(jù)在里面是處于一個核心的加工地位,他把數(shù)據(jù)轉化成中心和知識,不斷的產(chǎn)生更多的價值。
移動化是一種資源分配的策略,特別是零散的、碎片化資源的分配。移動化沒有帶來革命性的技術,但帶來了革命性的應用。移動時代到來后,人們更深入的與數(shù)據(jù)世界對接,拓寬了個人的邊界,也使得不同的能更加深度連接在一起。比如用滴滴打車,出租車司機能在接單或者開車的過程中決定接下來要干什么,把自己的零碎的時間更好地利用起來,甚至實現(xiàn)劃零為整。相反的,我們也可以看到并不是所有的應用都適合移動化,例如程序開發(fā)或者財務審計,這些工作需要大塊專注的時間和精力,無法利用零碎的資源完成。
社會化意味者廣泛的連接。但另一方面,人以群分物以類聚,社會化也決定了信息技術必須深入到垂直的行業(yè)應用才能充分發(fā)揮價值。因此,我們可以預見未來一定會形成多個垂直領域的“云大物移”,每個云內部將深度共享數(shù)據(jù)和信息,而云間則只進行適度的數(shù)據(jù)和信息交互。
簡單總結來講,在未來的信息社會中,云計算是骨骼,物聯(lián)網(wǎng)是整個信息里的感官,大數(shù)據(jù)是大腦,移動化是策略,社會化是最終的靈魂。
企業(yè)應用大數(shù)據(jù)的必備條件
一個企業(yè)或者一個組織如果想真的應用大數(shù)據(jù)的話,必須具備哪些條件呢?劉譯璟將其歸納為以下幾個方面:
相關的時代必須要到來
在高喊DT時代已經(jīng)到來的同時,我們看到的事實是很多企業(yè)連信息化的門檻都沒邁過。譬如很多的企業(yè)沒有CRM系統(tǒng),所有的會員管理還是依靠一些小本本,根本談不上數(shù)據(jù)化?;蛘吆芏嗥髽I(yè)只有本地化的一些系統(tǒng),還沒有進入到互聯(lián)網(wǎng)的時代,數(shù)據(jù)化程度很低,在這種前提下,談大數(shù)據(jù)是沒有什么意義的。
明確大數(shù)據(jù)的價值理念
今天,很多企業(yè)主在講數(shù)據(jù)是核心資產(chǎn),大數(shù)據(jù)很重要。但他們之所以這么說,原因是他認為數(shù)據(jù)只有花錢才能得來,而不是看到自己的經(jīng)營過程有很多數(shù)據(jù),可以做出數(shù)據(jù)化運營。這樣的情況下,說到底他并不清楚數(shù)據(jù)能對他的業(yè)務產(chǎn)生核心的變化。
什么叫做理念?就是不要用大數(shù)據(jù)做形象工程,而是相信數(shù)據(jù)能夠給業(yè)務創(chuàng)造價值,一定會用到業(yè)務里。當消費者跑到你的陣地上,一方面,你要盡可能把陣地上消費者最滿意的信息給到他,另一方面也要找到對你的產(chǎn)品感興趣的人,然后再基于數(shù)據(jù)分析整個過程。
哪怕一開始確實效果非常不好,甚至比以前可能下降,但是企業(yè)相信通過不斷的優(yōu)化不斷的反饋提高效率。大數(shù)據(jù)就是一顆大腦,這個大腦一開始是一片白紙什么,都不知道,我們只有通過一輪一輪的循環(huán)才能讓他真正變得更加智能。
大數(shù)據(jù)要驅動智能化的業(yè)務系統(tǒng),因此其中最核心的是人工智能相關的技術和應用知識是緊密相關的,包括自然語言理解、知識表示、自動求解和決策、機器學習,以及與此密切相關的圖象語音識別、智能Agent等技術。為了支持這些技術和應用,我們對數(shù)據(jù)存儲和計算的要求超出了以往任何時候,這就必須要有類似Hadoop的分布式存儲和計算技術。Hadoop的誕生,原因就搜索引擎的驅動;Spark的誕生,也是來自于機器學習算法的要求。
將業(yè)務轉化成數(shù)據(jù)的能力
從數(shù)據(jù)技術到大數(shù)據(jù)平臺,大數(shù)據(jù)技術的發(fā)展一定是跟著業(yè)務或者跟著智能化的技術發(fā)展的。其實,從企業(yè)的現(xiàn)實業(yè)務到真正構建數(shù)據(jù)模型,中間有非常大的鴻溝。這個鴻溝包括數(shù)據(jù)如何采集、如何建模、以及如何把一個業(yè)務問題轉化成真正的數(shù)據(jù)的問題。這其實是需要有具備深厚的理論和經(jīng)驗的人來才能完成的,是大數(shù)據(jù)落地中最具有挑戰(zhàn)性的一環(huán)。如果不能將一個實際問題轉化為數(shù)據(jù)和數(shù)學模型,那就沒有任何技術手段來實現(xiàn)它,更無法落地實踐。
大數(shù)據(jù)應該成為一種基本的使用和操作能力
大數(shù)據(jù)為商業(yè)企業(yè)全面、深刻認識消費者行為和市場需求提供了新的方式和視角。運用大數(shù)據(jù)分析消費者行為,并基于分析結果,采取合適的商業(yè)模式,是未來商業(yè)發(fā)展的一種趨勢,也是大數(shù)據(jù)在商業(yè)領域的重要應用。
百分點高級研發(fā)總劉國棟描述到,他們對大數(shù)據(jù)有一個理想,就是希望未來每一個普通的人都具備大數(shù)據(jù)的使用能力和操作能力,每一個人都能夠隨時隨地利用大數(shù)據(jù)的能力解決自己的問題。于是,他們在過去六七年的時間里都致力于研發(fā)一款可以填平大數(shù)據(jù)技術與企業(yè)應用之間鴻溝的產(chǎn)品——大數(shù)據(jù)操作系統(tǒng)(BD-OS)。
作為計算機的操作系統(tǒng),Windows系統(tǒng)讓人和機器更容易更快更便捷的交互,并把機器的高性能和處理復雜問題的能力賦予人類。大數(shù)據(jù)整個發(fā)展過程也是這樣的。BD-OS致力于解決人和大數(shù)據(jù)交互的問題,幫助人更輕松的挖掘和管理數(shù)據(jù)。在大數(shù)據(jù)操作系統(tǒng)這個層面,百分點做的第一件事就是將底層技術標準化,基于標準化提取出了一系列的解決方案和接口,基于解決方案和接口建立起了一個完整的、可持續(xù)的中間交互層,這個中間交互層的具體落地,可以通過交互層,通過不同的維度使用管理和深入探索挖掘大數(shù)據(jù),用戶不用關心底下具體的某種技術和某種問題,基本上用戶感覺不到是在跟Hadoop交互,或者跟Spark交互。對于用戶來講,在這個環(huán)境里工作根本感覺不到自己在使用特別復雜特別龐大的數(shù)據(jù),或者特別復雜的技術。
圖:BD-OS內置標準化處理模板
劉國棟這樣比喻,如果將Hadoop、Spark視作一粒一粒的珍珠,那么BD-OS就是一條線,將那些最亮最圓的東西串起來,而不會隨便挑一個技術放到整個BD-OS里面去。
更好的方法和答案還在不久的未來
就像舍恩伯格在《大數(shù)據(jù)時代》的結語中所道:“大數(shù)據(jù)并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10