
2011年的時(shí)候,大家開(kāi)始才講大數(shù)據(jù),有人說(shuō)這個(gè)是大數(shù)據(jù),有人說(shuō)那個(gè)是大數(shù)據(jù)。2012年的時(shí)候大家都在嘗試用大數(shù)據(jù)。而今年很奇怪,我們?nèi)ッ绹?guó)研討大數(shù)據(jù)的時(shí)候,發(fā)現(xiàn)大部分人已經(jīng)開(kāi)始停止講大這個(gè)詞了,開(kāi)始說(shuō)Data。這個(gè)詞是非常有意思的,我們把數(shù)據(jù)工程化,里面必須要有一個(gè)標(biāo)準(zhǔn)要出現(xiàn),而且在有標(biāo)準(zhǔn)要出現(xiàn)之后,還有一些樓層要出現(xiàn)。
那么Data我自己的想法是什么呢?我們這個(gè)Data要泛化更多的人要用,更多的人去用上數(shù)據(jù),就好象20年前我們讓每一個(gè)人用上科技,那今天的數(shù)據(jù)就是要給更多的人用。
現(xiàn)在我們擁有很大量的數(shù)據(jù),我們以前要做一個(gè)決定,可能要花很多的錢去投進(jìn)去要細(xì)想,但是今天我們擁有一些大數(shù)據(jù)的時(shí)候,我們以前一些非常難做的決策,相對(duì)來(lái)說(shuō)今天很容易做到,其實(shí)也是一個(gè)很重要的拐點(diǎn)。這個(gè)就是當(dāng)我們能使用數(shù)據(jù)去去判斷去一個(gè)問(wèn)題的時(shí)候,我們就用數(shù)據(jù)化解決問(wèn)題。
大數(shù)據(jù)已經(jīng)從4個(gè)V的年代,Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)延展至三個(gè)維度,可實(shí)時(shí)性、可解釋性、數(shù)據(jù)準(zhǔn)確/穩(wěn)定性。這三個(gè)維度是我們現(xiàn)在到底數(shù)據(jù)能不能用上的很重要的三個(gè)維度。
我們現(xiàn)在整個(gè)數(shù)據(jù)里面的問(wèn)題是什么呢?整個(gè)數(shù)據(jù)的問(wèn)題是,業(yè)務(wù)的人不知道數(shù)據(jù)怎么用?做數(shù)據(jù)的人不知道別人怎么用?所以里面是有一個(gè)很大的障礙在中間的,所以這是大數(shù)據(jù)鋪普遍存在的一個(gè)現(xiàn)象。如果今天我們有很多的大數(shù)據(jù),我們不是認(rèn)為有一個(gè)問(wèn)題說(shuō)要找數(shù)據(jù)來(lái)解決一個(gè)問(wèn)題,而是我們運(yùn)營(yíng)數(shù)據(jù),我們搜集很多數(shù)據(jù)的數(shù)據(jù)可以幫我們解決很多未來(lái)的問(wèn)題,這個(gè)才叫大數(shù)據(jù)。
過(guò)去阿里大數(shù)據(jù)做了兩個(gè)循環(huán),一個(gè)循環(huán)是在怎么用數(shù)據(jù),一個(gè)循環(huán)在下面是說(shuō)我們?cè)鯓羽B(yǎng)數(shù)據(jù),怎么改善數(shù)據(jù),兩個(gè)循環(huán)不斷的走動(dòng),所以我們?cè)趦蓚€(gè)循環(huán)里面不斷的進(jìn)步,所以數(shù)據(jù)是練出來(lái)的。
三年前,阿里巴巴的大數(shù)據(jù)不僅可以看,還是可以用的。但是今天走到一個(gè)地方是不僅僅讓你用,而且讓別人用。這一次的圈,當(dāng)我們要做讓別人用的時(shí)候,第二個(gè)圈就比以前那個(gè)圈更困難了,更注重精準(zhǔn)性。我們整個(gè)數(shù)據(jù)運(yùn)營(yíng)來(lái)講,會(huì)發(fā)現(xiàn)從整個(gè)運(yùn)營(yíng)里面產(chǎn)生了一些價(jià)值,同時(shí),我們整個(gè)東西里面我們找出很多新的數(shù)據(jù)跟新的工具。我們最近就在解決這些問(wèn)題,數(shù)據(jù)的產(chǎn)生、人才的不匹配、數(shù)據(jù)冗余、工具不統(tǒng)一,安全、質(zhì)量,這些都是我們做數(shù)據(jù)必須保障的,否則就不容易產(chǎn)生數(shù)據(jù)的價(jià)值。
其實(shí)兩年前,我是寫了一個(gè)大數(shù)據(jù)十誡,是講到我們?cè)谧鰯?shù)據(jù)的時(shí)候要關(guān)注的幾個(gè)問(wèn)題,我說(shuō)一切從問(wèn)題開(kāi)始,從實(shí)踐中提煉數(shù)據(jù),讓數(shù)據(jù)的體驗(yàn)變得超級(jí)簡(jiǎn)單,讓數(shù)據(jù)跟著人走,然后顛覆性來(lái)自分類跟重組等等?,F(xiàn)在在兩年后,我覺(jué)得要改變一下,所以數(shù)據(jù)質(zhì)量不敢保證是不敢用的,另外大安全不是監(jiān)管,監(jiān)管不了的。因?yàn)榇髷?shù)據(jù)本身有太大,你需要更多的人來(lái)用,但是用監(jiān)控的方法來(lái)監(jiān)管一個(gè)大數(shù)據(jù),沒(méi)有辦法監(jiān)管起來(lái)。
利用數(shù)據(jù)拿到更有用的數(shù)據(jù)這個(gè)很重要,以后建立數(shù)據(jù)的數(shù)據(jù)才有進(jìn)步,因?yàn)槲覀兤疵淖龊芏嗄0?,但是既然是沒(méi)有去保證今天的模板的數(shù)據(jù)質(zhì)量,今天的大數(shù)據(jù)做得好,如果連衡量自己大數(shù)據(jù)做得好不好都不知道?我們?cè)趺蠢^續(xù)做好大數(shù)據(jù)呢?所以我們要建立數(shù)據(jù)的數(shù)據(jù)才有進(jìn)步。
最后有一點(diǎn)很重要的是,我們要讓人做人擅長(zhǎng)做的事,機(jī)器做機(jī)器擅長(zhǎng)的事。千萬(wàn)不要倒過(guò)來(lái),人做了機(jī)器擅長(zhǎng)的事,以及機(jī)器做了人擅長(zhǎng)的事,這樣效率就會(huì)降低。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10