
都在說大數(shù)據(jù),但你知道大數(shù)據(jù)的核心價(jià)值是什么嗎
都說現(xiàn)在是大數(shù)據(jù)時(shí)代,那么大數(shù)據(jù)是什么?大數(shù)據(jù)有什么用?大數(shù)據(jù)最核心的價(jià)值是什么呢?其實(shí)大數(shù)據(jù)的核心價(jià)值很簡(jiǎn)單,就是了解用戶行為(更簡(jiǎn)單說就是了解用戶行為習(xí)慣)。今天我們就細(xì)說大數(shù)據(jù)的核心價(jià)值。
一、什么是元數(shù)據(jù)(Metadata)?
元數(shù)據(jù)是對(duì)數(shù)據(jù)本身進(jìn)行描述的數(shù)據(jù),或者說,它不是對(duì)象本身,它只描述對(duì)象的屬性。
比如,一幅畫本身,是數(shù)據(jù)。而這幅畫的作者、完成時(shí)間、尺寸、價(jià)格、類型等等,就是它的元數(shù)據(jù)。
又如,你媽給你介紹個(gè)相親對(duì)象,你并不認(rèn)識(shí)他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長(zhǎng),你心里也就對(duì)他有了印象。即便你還不認(rèn)識(shí)他。
元數(shù)據(jù)的價(jià)值
能夠從側(cè)面描述對(duì)象
可以結(jié)構(gòu)化、信息化
什么意思呢?
舉個(gè)栗子,要判斷一幅畫的價(jià)值,除了專家直接通過畫的藝術(shù)性來評(píng)價(jià)外,還可以通過元數(shù)據(jù)來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創(chuàng)作鼎盛時(shí)期的作品,還是在年輕時(shí)的作品?這幅畫是作者擅長(zhǎng)的類型還是他不熟悉的?
用這些元數(shù)據(jù)描述的信息,我們居然就能把這幅畫的價(jià)值算得八九不離十。這肯定會(huì)存在誤差,但這個(gè)判斷方法也非常合理。
二、那用元數(shù)據(jù)描述對(duì)象有什么意義呢?
這就是在大數(shù)據(jù)上產(chǎn)生的價(jià)值:對(duì)于非結(jié)構(gòu)化的、非量化的對(duì)象,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計(jì)算和判斷。
再舉個(gè)栗子,你媽給你找了100個(gè)相關(guān)對(duì)象,手里有100份資料,你要是一個(gè)一個(gè)去仔細(xì)翻閱,那幾天都翻不完。但你告訴你媽,高學(xué)歷的可能意味著素質(zhì)很高, 高收入的可能意味著能力很強(qiáng),所以先把低學(xué)歷低收入的篩掉,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會(huì)有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率很低很低了。
這效果在相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中,產(chǎn)生的效果就天翻地覆了。
三、大數(shù)據(jù)應(yīng)用階段一:輔助產(chǎn)品
剛開始比較簡(jiǎn)單,就是用以輔助產(chǎn)品人員和市場(chǎng)人員做判斷。
過去的實(shí)體產(chǎn)品做一次調(diào)研非常麻煩。比如飲料公司,調(diào)研人員要用各種方式觀看他們喝飲料的場(chǎng)景和步驟。
問卷是最常見的,但不準(zhǔn)。所以會(huì)組織各種各樣專業(yè)的現(xiàn)場(chǎng)試驗(yàn),要搭建環(huán)境(一般是有單面玻璃或攝像頭的)、邀請(qǐng)志愿者,然后引導(dǎo)他們按照日常的習(xí)慣去完成一些操作。
比如這樣的通過攝像頭監(jiān)視觀察室,顯然這種辦法非常笨重、成本高。
現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品根本不需要這么麻煩。用戶所有的使用數(shù)據(jù)、行為,都是記錄在案的,想知道什么,瞬間就能分析出來。
過去想知道用戶有沒有做一件事,比如有沒有用過這個(gè)功能?太難了。
現(xiàn)在呢,就問點(diǎn)擊這個(gè)行為,點(diǎn)擊了幾下、點(diǎn)擊在哪里,什么時(shí)候點(diǎn)的,甚至這是在什么地方點(diǎn)的、點(diǎn)擊之后又做了什么,一清二楚。
用戶平時(shí)用不用這個(gè)功能、怎么用這個(gè)功能,也就一目了然。
對(duì)于產(chǎn)品設(shè)計(jì)者來說,這是至關(guān)重要的數(shù)據(jù)。而且,這是完整的數(shù)據(jù)!如果是互聯(lián)網(wǎng)產(chǎn)品,那么我知道的是所有用戶的數(shù)據(jù),不是過去傳統(tǒng)行業(yè)產(chǎn)品的樣本數(shù)據(jù)。
騰訊知道所有微信用戶有多少用朋友圈、知道這些用戶每天都發(fā)幾條朋友圈、知道這些用戶每天都發(fā)了什么。每一個(gè)數(shù)據(jù)都是真實(shí)可用的。(過去發(fā)行量再大的報(bào)紙也很難知道讀者性別,然而現(xiàn)在再小的微信公眾號(hào)也可以實(shí)時(shí)獲取。)
在實(shí)體產(chǎn)品的行業(yè),隨著未來整個(gè)產(chǎn)品從生產(chǎn)到銷售到使用的信息化,大數(shù)據(jù)也會(huì)漸漸起到更大的作用。過去賣一瓶水,可能到某個(gè)超市就斷掉了,我不知道這瓶水被 誰買走了。但現(xiàn)在在天貓賣的一瓶水,我知道對(duì)方這個(gè)用戶是每個(gè)月買十箱水的,他的地址是某個(gè)高檔餐廳,那我就知道這瓶水的目標(biāo)受眾是誰了。
這是元數(shù)據(jù)的價(jià)值所在。
所以說,大數(shù)據(jù)的第一階段是:輔助產(chǎn)品設(shè)計(jì)者做判斷、讓產(chǎn)品制造者更好地滿足用戶。
這時(shí)候的大數(shù)據(jù)主要是來為產(chǎn)品提供支持,產(chǎn)品再應(yīng)用于用戶。
四、大數(shù)據(jù)應(yīng)用階段二:創(chuàng)造價(jià)值
在數(shù)據(jù)的數(shù)量和質(zhì)量達(dá)到一定程度后,事情開始變化了。元數(shù)據(jù)將不僅作為產(chǎn)品的輔助,而是變成了最有價(jià)值的產(chǎn)生本身。
很簡(jiǎn)單的,全中國(guó)最熟悉老百姓消費(fèi)習(xí)慣的誰嗎?是哪個(gè)科研機(jī)構(gòu)嗎?都不是,是淘寶。
擁有最全面的個(gè)人信用信息的,是人事局嗎?是銀行嗎?NO!NO!NO,是支付寶。
道理也簡(jiǎn)單得很,所有這些行為(消費(fèi)、交易)發(fā)生在了這個(gè)平臺(tái)上,而這個(gè)平臺(tái)又有所有數(shù)據(jù)的記錄,那這些數(shù)據(jù)就能產(chǎn)生巨大的價(jià)值。
你以為做醫(yī)療健康這方面的產(chǎn)品僅僅是關(guān)注你的健康嗎?并不是,他們同時(shí)還能夠記錄你所有的體征,這是第一線的臨床數(shù)據(jù)。
此時(shí),大數(shù)據(jù)本身已經(jīng)成為了產(chǎn)品,可以輸出有價(jià)值的內(nèi)容。
消費(fèi)行為數(shù)據(jù),賣給廣告商,廣告商就可以定向給你投送廣告;信用數(shù)據(jù),賣給銀行,銀行就可以判斷出你的信用程度;健康數(shù)據(jù),賣給保險(xiǎn)公司…你懂的(當(dāng)然,我們不提倡這樣做)。
近幾年,互聯(lián)網(wǎng)公司已經(jīng)能夠?qū)θ珖?guó)各領(lǐng)域的市場(chǎng),給出最有說服力的統(tǒng)計(jì)報(bào)告了,這些之前可都是政府做的:
淘寶網(wǎng)發(fā)布《中國(guó)互聯(lián)網(wǎng)消費(fèi)趨勢(shì)報(bào)告》
攜程旅行網(wǎng)發(fā)布《2014年旅游者調(diào)查報(bào)告》
滴滴攜兩大機(jī)構(gòu)發(fā)布首份《智能出行年度報(bào)告》
其實(shí)出售數(shù)據(jù)是比較愚蠢的方法,數(shù)據(jù)提供的內(nèi)容完全可以創(chuàng)造出新的產(chǎn)品。尤其像O2O 這樣的產(chǎn)品/服務(wù),上游是服務(wù)提供者和資源,下游是用戶,都能夠有價(jià)值可以發(fā)掘。
比如,在紐帶線CRM系統(tǒng)中,通過商務(wù)社交功能,了解下游企業(yè)間的供求信息,通過社交,促進(jìn)企業(yè)間的交易合作,定向把企業(yè)間的供求準(zhǔn)確配對(duì),減少企業(yè)的成本,這就充分體現(xiàn)了用戶數(shù)據(jù)產(chǎn)生價(jià)值。這也是他這個(gè)商務(wù)社交功能的核心思想了。
聽說餓了么在嘗試一項(xiàng)新服務(wù),就是為餐館提供食材。一聽嚇一跳,你TM在逗我么?但后來想想的確是再合理不過。除了餓了么還有誰更能清楚某塊區(qū)域的餐品售賣數(shù)據(jù)呢?這地方蘿卜白菜賣得多、有多少量,餓了么清楚得很,跟農(nóng)場(chǎng)談合作,可以很好地把控上游渠道。
這階段的大數(shù)據(jù),已經(jīng)可以成為產(chǎn)品,為用戶直接服務(wù)。
從另一個(gè)角度看,不知道你發(fā)現(xiàn)沒,通過我們行為數(shù)據(jù)這些元數(shù)據(jù),我們已經(jīng)在慢慢被量化的信息給描述出來了。看到這些數(shù)字(一年花了多少錢、在哪方面花的錢等等)已經(jīng)對(duì)這個(gè)人可以有相對(duì)粗糙的認(rèn)識(shí)了。
而大數(shù)據(jù)最終的形態(tài)開始初現(xiàn)。
五、大數(shù)據(jù)應(yīng)用階段三:塑造我們
可能我們對(duì)對(duì)行為數(shù)據(jù)表示不屑。你知道我在網(wǎng)上買了點(diǎn)東西、跟誰微信聊了幾句話、去百度隨便查了點(diǎn)東西,就能知道我是什么人了?
別說,還真可以。只要數(shù)據(jù)保質(zhì)保量。
我們舉個(gè)栗子,你一個(gè)月沒買避孕套這兩天突然買了三盒,那可能是你要跟異地戀的女朋友見面了;你微信跟異地的某個(gè)妹子聊得特別多、經(jīng)常還視頻,那這大概就是你異地的女朋友;你在百度一直搜東南亞的機(jī)票和旅行攻略,那你可能要去那里玩。
就是這么簡(jiǎn)單的三條元數(shù)據(jù),我們可以大楖推測(cè)出來,最近你要跟女朋友一起去東南亞旅行。
說實(shí)話,做這么基礎(chǔ)的邏輯推斷,比下圍棋容易多了。
這是說明元數(shù)據(jù)能夠推理信息的邏輯性。而對(duì)于可獲取的元數(shù)據(jù),也越來越多了。
你打電話時(shí),可以知道你給誰打(婦科醫(yī)生?要生孩子了。律師?最近有官司。)
你買東西時(shí),可以知道你的消費(fèi)能力、家庭狀況、喜好甚至性格(高端筆記本?愛玩游戲。吉他、鋼琴?喜歡音樂。)
你出門消費(fèi)時(shí),可以知道你的生活習(xí)慣和個(gè)人情況(健身房?應(yīng)該很健康。經(jīng)常大保???可能身體比較虛。)
你加別人微信時(shí),可以知道你的社交圈子(認(rèn)識(shí)李開復(fù)?應(yīng)該不是一般人。通訊錄里都是老師?那可能也是一名教師。)
作為這些產(chǎn)品的數(shù)據(jù)的擁有者,完全不需要派個(gè)私家偵探來跟蹤你。只需要等你自己乖乖把這些數(shù)據(jù)送上來。
春節(jié)的時(shí)候,支付寶為什么要和微信爭(zhēng)搶小額支付和社交場(chǎng)景的支付?不是為了那點(diǎn)手續(xù)費(fèi),就是為了它缺失的社交支付這一塊。這塊數(shù)據(jù)的價(jià)值,超乎你想象。
未來我們每個(gè)人的衣食住行、生活起居,都將有大量的數(shù)據(jù)記錄。我們的行為會(huì)變成一串串?dāng)?shù)字成為可量化的數(shù)據(jù),成為描述我們的信息。我們工作用紐帶線CRM、吃飯用餓了么、打車用滴滴、搜東西用百度、社交用微信,每一步都被記了下來。
不信你可以翻出你歷史所有在搜索引擎的搜索記錄來,對(duì)你生活的描述絕對(duì)比你自己的日記都要真實(shí)得多。
這些數(shù)據(jù)將被轉(zhuǎn)換成有價(jià)值的商業(yè)數(shù)據(jù),來描述你各方面的信息。你喜歡黑色的衣服、你喜歡胸大的妹子、你比較文藝、你有高度近視、你最近剛失戀…… 關(guān)于你,可能這些數(shù)據(jù)比你自己都要清楚。
最終,我們本身就是可以被量化的大數(shù)據(jù)對(duì)象,不存在多層的邏輯了。
這樣的未來自然有利有弊。利是我們無處不在享受著大數(shù)據(jù)帶來的便利,我們看到的每一條廣告都會(huì)是我們自己喜歡的,我們查的每一條搜索記錄都是根據(jù)我們特點(diǎn)來推薦的,我們?cè)诩雍糜褧r(shí)系統(tǒng)甚至都可以說他是不是會(huì)跟我們合得來。
弊在于,我們的隱私就暴露無疑。只要數(shù)據(jù)的擁有者想做點(diǎn)壞事,那真的一切皆有可能了。
大數(shù)據(jù)絕不會(huì)止步在為決策僅僅提供幫助,它的終極形態(tài)就是可以用海量的數(shù)據(jù)描述我們一個(gè)個(gè)具體的個(gè)體。當(dāng)達(dá)到這一步時(shí),現(xiàn)在所謂的市場(chǎng)調(diào)研、用戶分析就太小兒科不過了。
因?yàn)椋?a href="http://www.3lll3.cn/" target="_blank">大數(shù)據(jù)已經(jīng)完全能夠塑造出我們了。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11