
都在說大數(shù)據(jù),但你知道大數(shù)據(jù)的核心價(jià)值是什么嗎
都說現(xiàn)在是大數(shù)據(jù)時(shí)代,那么大數(shù)據(jù)是什么?大數(shù)據(jù)有什么用?大數(shù)據(jù)最核心的價(jià)值是什么呢?其實(shí)大數(shù)據(jù)的核心價(jià)值很簡(jiǎn)單,就是了解用戶行為(更簡(jiǎn)單說就是了解用戶行為習(xí)慣)。今天我們就細(xì)說大數(shù)據(jù)的核心價(jià)值。
一、什么是元數(shù)據(jù)(Metadata)?
元數(shù)據(jù)是對(duì)數(shù)據(jù)本身進(jìn)行描述的數(shù)據(jù),或者說,它不是對(duì)象本身,它只描述對(duì)象的屬性。
比如,一幅畫本身,是數(shù)據(jù)。而這幅畫的作者、完成時(shí)間、尺寸、價(jià)格、類型等等,就是它的元數(shù)據(jù)。
又如,你媽給你介紹個(gè)相親對(duì)象,你并不認(rèn)識(shí)他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長(zhǎng),你心里也就對(duì)他有了印象。即便你還不認(rèn)識(shí)他。
元數(shù)據(jù)的價(jià)值
能夠從側(cè)面描述對(duì)象
可以結(jié)構(gòu)化、信息化
什么意思呢?
舉個(gè)栗子,要判斷一幅畫的價(jià)值,除了專家直接通過畫的藝術(shù)性來評(píng)價(jià)外,還可以通過元數(shù)據(jù)來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創(chuàng)作鼎盛時(shí)期的作品,還是在年輕時(shí)的作品?這幅畫是作者擅長(zhǎng)的類型還是他不熟悉的?
用這些元數(shù)據(jù)描述的信息,我們居然就能把這幅畫的價(jià)值算得八九不離十。這肯定會(huì)存在誤差,但這個(gè)判斷方法也非常合理。
二、那用元數(shù)據(jù)描述對(duì)象有什么意義呢?
這就是在大數(shù)據(jù)上產(chǎn)生的價(jià)值:對(duì)于非結(jié)構(gòu)化的、非量化的對(duì)象,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計(jì)算和判斷。
再舉個(gè)栗子,你媽給你找了100個(gè)相關(guān)對(duì)象,手里有100份資料,你要是一個(gè)一個(gè)去仔細(xì)翻閱,那幾天都翻不完。但你告訴你媽,高學(xué)歷的可能意味著素質(zhì)很高, 高收入的可能意味著能力很強(qiáng),所以先把低學(xué)歷低收入的篩掉,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會(huì)有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率很低很低了。
這效果在相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中,產(chǎn)生的效果就天翻地覆了。
三、大數(shù)據(jù)應(yīng)用階段一:輔助產(chǎn)品
剛開始比較簡(jiǎn)單,就是用以輔助產(chǎn)品人員和市場(chǎng)人員做判斷。
過去的實(shí)體產(chǎn)品做一次調(diào)研非常麻煩。比如飲料公司,調(diào)研人員要用各種方式觀看他們喝飲料的場(chǎng)景和步驟。
問卷是最常見的,但不準(zhǔn)。所以會(huì)組織各種各樣專業(yè)的現(xiàn)場(chǎng)試驗(yàn),要搭建環(huán)境(一般是有單面玻璃或攝像頭的)、邀請(qǐng)志愿者,然后引導(dǎo)他們按照日常的習(xí)慣去完成一些操作。
比如這樣的通過攝像頭監(jiān)視觀察室,顯然這種辦法非常笨重、成本高。
現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品根本不需要這么麻煩。用戶所有的使用數(shù)據(jù)、行為,都是記錄在案的,想知道什么,瞬間就能分析出來。
過去想知道用戶有沒有做一件事,比如有沒有用過這個(gè)功能?太難了。
現(xiàn)在呢,就問點(diǎn)擊這個(gè)行為,點(diǎn)擊了幾下、點(diǎn)擊在哪里,什么時(shí)候點(diǎn)的,甚至這是在什么地方點(diǎn)的、點(diǎn)擊之后又做了什么,一清二楚。
用戶平時(shí)用不用這個(gè)功能、怎么用這個(gè)功能,也就一目了然。
對(duì)于產(chǎn)品設(shè)計(jì)者來說,這是至關(guān)重要的數(shù)據(jù)。而且,這是完整的數(shù)據(jù)!如果是互聯(lián)網(wǎng)產(chǎn)品,那么我知道的是所有用戶的數(shù)據(jù),不是過去傳統(tǒng)行業(yè)產(chǎn)品的樣本數(shù)據(jù)。
騰訊知道所有微信用戶有多少用朋友圈、知道這些用戶每天都發(fā)幾條朋友圈、知道這些用戶每天都發(fā)了什么。每一個(gè)數(shù)據(jù)都是真實(shí)可用的。(過去發(fā)行量再大的報(bào)紙也很難知道讀者性別,然而現(xiàn)在再小的微信公眾號(hào)也可以實(shí)時(shí)獲取。)
在實(shí)體產(chǎn)品的行業(yè),隨著未來整個(gè)產(chǎn)品從生產(chǎn)到銷售到使用的信息化,大數(shù)據(jù)也會(huì)漸漸起到更大的作用。過去賣一瓶水,可能到某個(gè)超市就斷掉了,我不知道這瓶水被 誰買走了。但現(xiàn)在在天貓賣的一瓶水,我知道對(duì)方這個(gè)用戶是每個(gè)月買十箱水的,他的地址是某個(gè)高檔餐廳,那我就知道這瓶水的目標(biāo)受眾是誰了。
這是元數(shù)據(jù)的價(jià)值所在。
所以說,大數(shù)據(jù)的第一階段是:輔助產(chǎn)品設(shè)計(jì)者做判斷、讓產(chǎn)品制造者更好地滿足用戶。
這時(shí)候的大數(shù)據(jù)主要是來為產(chǎn)品提供支持,產(chǎn)品再應(yīng)用于用戶。
四、大數(shù)據(jù)應(yīng)用階段二:創(chuàng)造價(jià)值
在數(shù)據(jù)的數(shù)量和質(zhì)量達(dá)到一定程度后,事情開始變化了。元數(shù)據(jù)將不僅作為產(chǎn)品的輔助,而是變成了最有價(jià)值的產(chǎn)生本身。
很簡(jiǎn)單的,全中國(guó)最熟悉老百姓消費(fèi)習(xí)慣的誰嗎?是哪個(gè)科研機(jī)構(gòu)嗎?都不是,是淘寶。
擁有最全面的個(gè)人信用信息的,是人事局嗎?是銀行嗎?NO!NO!NO,是支付寶。
道理也簡(jiǎn)單得很,所有這些行為(消費(fèi)、交易)發(fā)生在了這個(gè)平臺(tái)上,而這個(gè)平臺(tái)又有所有數(shù)據(jù)的記錄,那這些數(shù)據(jù)就能產(chǎn)生巨大的價(jià)值。
你以為做醫(yī)療健康這方面的產(chǎn)品僅僅是關(guān)注你的健康嗎?并不是,他們同時(shí)還能夠記錄你所有的體征,這是第一線的臨床數(shù)據(jù)。
此時(shí),大數(shù)據(jù)本身已經(jīng)成為了產(chǎn)品,可以輸出有價(jià)值的內(nèi)容。
消費(fèi)行為數(shù)據(jù),賣給廣告商,廣告商就可以定向給你投送廣告;信用數(shù)據(jù),賣給銀行,銀行就可以判斷出你的信用程度;健康數(shù)據(jù),賣給保險(xiǎn)公司…你懂的(當(dāng)然,我們不提倡這樣做)。
近幾年,互聯(lián)網(wǎng)公司已經(jīng)能夠?qū)θ珖?guó)各領(lǐng)域的市場(chǎng),給出最有說服力的統(tǒng)計(jì)報(bào)告了,這些之前可都是政府做的:
淘寶網(wǎng)發(fā)布《中國(guó)互聯(lián)網(wǎng)消費(fèi)趨勢(shì)報(bào)告》
攜程旅行網(wǎng)發(fā)布《2014年旅游者調(diào)查報(bào)告》
滴滴攜兩大機(jī)構(gòu)發(fā)布首份《智能出行年度報(bào)告》
其實(shí)出售數(shù)據(jù)是比較愚蠢的方法,數(shù)據(jù)提供的內(nèi)容完全可以創(chuàng)造出新的產(chǎn)品。尤其像O2O 這樣的產(chǎn)品/服務(wù),上游是服務(wù)提供者和資源,下游是用戶,都能夠有價(jià)值可以發(fā)掘。
比如,在紐帶線CRM系統(tǒng)中,通過商務(wù)社交功能,了解下游企業(yè)間的供求信息,通過社交,促進(jìn)企業(yè)間的交易合作,定向把企業(yè)間的供求準(zhǔn)確配對(duì),減少企業(yè)的成本,這就充分體現(xiàn)了用戶數(shù)據(jù)產(chǎn)生價(jià)值。這也是他這個(gè)商務(wù)社交功能的核心思想了。
聽說餓了么在嘗試一項(xiàng)新服務(wù),就是為餐館提供食材。一聽嚇一跳,你TM在逗我么?但后來想想的確是再合理不過。除了餓了么還有誰更能清楚某塊區(qū)域的餐品售賣數(shù)據(jù)呢?這地方蘿卜白菜賣得多、有多少量,餓了么清楚得很,跟農(nóng)場(chǎng)談合作,可以很好地把控上游渠道。
這階段的大數(shù)據(jù),已經(jīng)可以成為產(chǎn)品,為用戶直接服務(wù)。
從另一個(gè)角度看,不知道你發(fā)現(xiàn)沒,通過我們行為數(shù)據(jù)這些元數(shù)據(jù),我們已經(jīng)在慢慢被量化的信息給描述出來了??吹竭@些數(shù)字(一年花了多少錢、在哪方面花的錢等等)已經(jīng)對(duì)這個(gè)人可以有相對(duì)粗糙的認(rèn)識(shí)了。
而大數(shù)據(jù)最終的形態(tài)開始初現(xiàn)。
五、大數(shù)據(jù)應(yīng)用階段三:塑造我們
可能我們對(duì)對(duì)行為數(shù)據(jù)表示不屑。你知道我在網(wǎng)上買了點(diǎn)東西、跟誰微信聊了幾句話、去百度隨便查了點(diǎn)東西,就能知道我是什么人了?
別說,還真可以。只要數(shù)據(jù)保質(zhì)保量。
我們舉個(gè)栗子,你一個(gè)月沒買避孕套這兩天突然買了三盒,那可能是你要跟異地戀的女朋友見面了;你微信跟異地的某個(gè)妹子聊得特別多、經(jīng)常還視頻,那這大概就是你異地的女朋友;你在百度一直搜東南亞的機(jī)票和旅行攻略,那你可能要去那里玩。
就是這么簡(jiǎn)單的三條元數(shù)據(jù),我們可以大楖推測(cè)出來,最近你要跟女朋友一起去東南亞旅行。
說實(shí)話,做這么基礎(chǔ)的邏輯推斷,比下圍棋容易多了。
這是說明元數(shù)據(jù)能夠推理信息的邏輯性。而對(duì)于可獲取的元數(shù)據(jù),也越來越多了。
你打電話時(shí),可以知道你給誰打(婦科醫(yī)生?要生孩子了。律師?最近有官司。)
你買東西時(shí),可以知道你的消費(fèi)能力、家庭狀況、喜好甚至性格(高端筆記本?愛玩游戲。吉他、鋼琴?喜歡音樂。)
你出門消費(fèi)時(shí),可以知道你的生活習(xí)慣和個(gè)人情況(健身房?應(yīng)該很健康。經(jīng)常大保健?可能身體比較虛。)
你加別人微信時(shí),可以知道你的社交圈子(認(rèn)識(shí)李開復(fù)?應(yīng)該不是一般人。通訊錄里都是老師?那可能也是一名教師。)
作為這些產(chǎn)品的數(shù)據(jù)的擁有者,完全不需要派個(gè)私家偵探來跟蹤你。只需要等你自己乖乖把這些數(shù)據(jù)送上來。
春節(jié)的時(shí)候,支付寶為什么要和微信爭(zhēng)搶小額支付和社交場(chǎng)景的支付?不是為了那點(diǎn)手續(xù)費(fèi),就是為了它缺失的社交支付這一塊。這塊數(shù)據(jù)的價(jià)值,超乎你想象。
未來我們每個(gè)人的衣食住行、生活起居,都將有大量的數(shù)據(jù)記錄。我們的行為會(huì)變成一串串?dāng)?shù)字成為可量化的數(shù)據(jù),成為描述我們的信息。我們工作用紐帶線CRM、吃飯用餓了么、打車用滴滴、搜東西用百度、社交用微信,每一步都被記了下來。
不信你可以翻出你歷史所有在搜索引擎的搜索記錄來,對(duì)你生活的描述絕對(duì)比你自己的日記都要真實(shí)得多。
這些數(shù)據(jù)將被轉(zhuǎn)換成有價(jià)值的商業(yè)數(shù)據(jù),來描述你各方面的信息。你喜歡黑色的衣服、你喜歡胸大的妹子、你比較文藝、你有高度近視、你最近剛失戀…… 關(guān)于你,可能這些數(shù)據(jù)比你自己都要清楚。
最終,我們本身就是可以被量化的大數(shù)據(jù)對(duì)象,不存在多層的邏輯了。
這樣的未來自然有利有弊。利是我們無處不在享受著大數(shù)據(jù)帶來的便利,我們看到的每一條廣告都會(huì)是我們自己喜歡的,我們查的每一條搜索記錄都是根據(jù)我們特點(diǎn)來推薦的,我們?cè)诩雍糜褧r(shí)系統(tǒng)甚至都可以說他是不是會(huì)跟我們合得來。
弊在于,我們的隱私就暴露無疑。只要數(shù)據(jù)的擁有者想做點(diǎn)壞事,那真的一切皆有可能了。
大數(shù)據(jù)絕不會(huì)止步在為決策僅僅提供幫助,它的終極形態(tài)就是可以用海量的數(shù)據(jù)描述我們一個(gè)個(gè)具體的個(gè)體。當(dāng)達(dá)到這一步時(shí),現(xiàn)在所謂的市場(chǎng)調(diào)研、用戶分析就太小兒科不過了。
因?yàn)椋?a href="http://www.3lll3.cn/" target="_blank">大數(shù)據(jù)已經(jīng)完全能夠塑造出我們了。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07