
互聯(lián)網(wǎng)時(shí)代大數(shù)據(jù)的核心價(jià)值
都說(shuō)現(xiàn)在是大數(shù)據(jù)時(shí)代,那么大數(shù)據(jù)是什么?大數(shù)據(jù)有什么用?大數(shù)據(jù)最核心的價(jià)值是什么呢?其實(shí)大數(shù)據(jù)的核心價(jià)值很簡(jiǎn)單,就是了解用戶行為(更簡(jiǎn)單說(shuō)就是了解用戶行為習(xí)慣)。今天我們就細(xì)說(shuō)大數(shù)據(jù)的核心價(jià)值。
一、什么是元數(shù)據(jù)(Metadata)?
元數(shù)據(jù)是對(duì)數(shù)據(jù)本身進(jìn)行描述的數(shù)據(jù),或者說(shuō),它不是對(duì)象本身,它只描述對(duì)象的屬性。
比如,一幅畫(huà)本身,是數(shù)據(jù)。而這幅畫(huà)的作者、完成時(shí)間、尺寸、價(jià)格、類型等等,就是它的元數(shù)據(jù)。
又如,你媽給你介紹個(gè)相親對(duì)象,你并不認(rèn)識(shí)他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛(ài)好特長(zhǎng),你心里也就對(duì)他有了印象。即便你還不認(rèn)識(shí)他。
元數(shù)據(jù)的價(jià)值
① 能夠從側(cè)面描述對(duì)象
② 可以結(jié)構(gòu)化、信息化
什么意思呢?
舉個(gè)栗子,要判斷一幅畫(huà)的價(jià)值,除了專家直接通過(guò)畫(huà)的藝術(shù)性來(lái)評(píng)價(jià)外,還可以通過(guò)元數(shù)據(jù)來(lái)判斷。
這幅畫(huà)是名家的還是二流畫(huà)家的?這幅畫(huà)是作者在他創(chuàng)作鼎盛時(shí)期的作品,還是在年輕時(shí)的作品?這幅畫(huà)是作者擅長(zhǎng)的類型還是他不熟悉的?
用這些元數(shù)據(jù)描述的信息,我們居然就能把這幅畫(huà)的價(jià)值算得八九不離十。這肯定會(huì)存在誤差,但這個(gè)判斷方法也非常合理。
二、那用元數(shù)據(jù)描述對(duì)象有什么意義呢?
這就是在大數(shù)據(jù)上產(chǎn)生的價(jià)值:對(duì)于非結(jié)構(gòu)化的、非量化的對(duì)象,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計(jì)算和判斷。
再舉個(gè)栗子,你媽給你找了100個(gè)相關(guān)對(duì)象,手里有100份資料,你要是一個(gè)一個(gè)去仔細(xì)翻閱,那幾天都翻不完。但你告訴你媽,高學(xué)歷的可能意味著素質(zhì)很高, 高收入的可能意味著能力很強(qiáng),所以先把低學(xué)歷低收入的篩掉,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會(huì)有失誤的,說(shuō)不定真愛(ài)就在被篩掉的人里。但這樣的概率很低很低了。
這效果在相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中,產(chǎn)生的效果就天翻地覆了。
三、大數(shù)據(jù)應(yīng)用階段一:輔助產(chǎn)品
剛開(kāi)始比較簡(jiǎn)單,就是用以輔助產(chǎn)品人員和市場(chǎng)人員做判斷。
過(guò)去的實(shí)體產(chǎn)品做一次調(diào)研非常麻煩。比如飲料公司,調(diào)研人員要用各種方式觀看他們喝飲料的場(chǎng)景和步驟。
問(wèn)卷是最常見(jiàn)的,但不準(zhǔn)。所以會(huì)組織各種各樣專業(yè)的現(xiàn)場(chǎng)試驗(yàn),要搭建環(huán)境(一般是有單面玻璃或攝像頭的)、邀請(qǐng)志愿者,然后引導(dǎo)他們按照日常的習(xí)慣去完成一些操作。
比如這樣的通過(guò)攝像頭監(jiān)視觀察室,顯然這種辦法非常笨重、成本高。
現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品根本不需要這么麻煩。用戶所有的使用數(shù)據(jù)、行為,都是記錄在案的,想知道什么,瞬間就能分析出來(lái)。
過(guò)去想知道用戶有沒(méi)有做一件事,比如有沒(méi)有用過(guò)這個(gè)功能?太難了。
現(xiàn)在呢,就問(wèn)點(diǎn)擊這個(gè)行為,點(diǎn)擊了幾下、點(diǎn)擊在哪里,什么時(shí)候點(diǎn)的,甚至這是在什么地方點(diǎn)的、點(diǎn)擊之后又做了什么,一清二楚。
用戶平時(shí)用不用這個(gè)功能、怎么用這個(gè)功能,也就一目了然。
對(duì)于產(chǎn)品設(shè)計(jì)者來(lái)說(shuō),這是至關(guān)重要的數(shù)據(jù)。而且,這是完整的數(shù)據(jù)!如果是互聯(lián)網(wǎng)產(chǎn)品,那么我知道的是所有用戶的數(shù)據(jù),不是過(guò)去傳統(tǒng)行業(yè)產(chǎn)品的樣本數(shù)據(jù)。
騰訊知道所有微信用戶有多少用朋友圈、知道這些用戶每天都發(fā)幾條朋友圈、知道這些用戶每天都發(fā)了什么。每一個(gè)數(shù)據(jù)都是真實(shí)可用的。
(過(guò)去發(fā)行量再大的報(bào)紙也很難知道讀者性別,然而現(xiàn)在再小的微信公眾號(hào)也可以實(shí)時(shí)獲取。)
在實(shí)體產(chǎn)品的行業(yè),隨著未來(lái)整個(gè)產(chǎn)品從生產(chǎn)到銷(xiāo)售到使用的信息化,大數(shù)據(jù)也會(huì)漸漸起到更大的作用。過(guò)去賣(mài)一瓶水,可能到某個(gè)超市就斷掉了,我不知道這瓶水被 誰(shuí)買(mǎi)走了。但現(xiàn)在在天貓賣(mài)的一瓶水,我知道對(duì)方這個(gè)用戶是每個(gè)月買(mǎi)十箱水的,他的地址是某個(gè)高檔餐廳,那我就知道這瓶水的目標(biāo)受眾是誰(shuí)了。
這是元數(shù)據(jù)的價(jià)值所在。
所以說(shuō),大數(shù)據(jù)的第一階段是:輔助產(chǎn)品設(shè)計(jì)者做判斷、讓產(chǎn)品制造者更好地滿足用戶。
這時(shí)候的大數(shù)據(jù)主要是來(lái)為產(chǎn)品提供支持,產(chǎn)品再應(yīng)用于用戶。
四、大數(shù)據(jù)應(yīng)用階段二:創(chuàng)造價(jià)值
在數(shù)據(jù)的數(shù)量和質(zhì)量達(dá)到一定程度后,事情開(kāi)始變化了。元數(shù)據(jù)將不僅作為產(chǎn)品的輔助,而是變成了最有價(jià)值的產(chǎn)生本身。
很簡(jiǎn)單的,全中國(guó)最熟悉老百姓消費(fèi)習(xí)慣的誰(shuí)嗎?是哪個(gè)科研機(jī)構(gòu)嗎?都不是,是淘寶。
擁有最全面的個(gè)人信用信息的,是人事局嗎?是銀行嗎?NO!NO!NO,是支付寶。
道理也簡(jiǎn)單得很,所有這些行為(消費(fèi)、交易)發(fā)生在了這個(gè)平臺(tái)上,而這個(gè)平臺(tái)又有所有數(shù)據(jù)的記錄,那這些數(shù)據(jù)就能產(chǎn)生巨大的價(jià)值。
你以為做醫(yī)療健康這方面的產(chǎn)品僅僅是關(guān)注你的健康嗎?并不是,他們同時(shí)還能夠記錄你所有的體征,這是第一線的臨床數(shù)據(jù)。
此時(shí),大數(shù)據(jù)本身已經(jīng)成為了產(chǎn)品,可以輸出有價(jià)值的內(nèi)容。
消費(fèi)行為數(shù)據(jù),賣(mài)給廣告商,廣告商就可以定向給你投送廣告;信用數(shù)據(jù),賣(mài)給銀行,銀行就可以判斷出你的信用程度;健康數(shù)據(jù),賣(mài)給保險(xiǎn)公司...你懂的(當(dāng)然,我們不提倡這樣做)。
近幾年,互聯(lián)網(wǎng)公司已經(jīng)能夠?qū)θ珖?guó)各領(lǐng)域的市場(chǎng),給出最有說(shuō)服力的統(tǒng)計(jì)報(bào)告了,這些之前可都是政府做的:
淘寶網(wǎng)發(fā)布中國(guó)互聯(lián)網(wǎng)消費(fèi)趨勢(shì)報(bào)告
攜程旅行網(wǎng)發(fā)布《2014年旅游者調(diào)查報(bào)告》
滴滴攜兩大機(jī)構(gòu)發(fā)布首份智能出行年度報(bào)告
其實(shí)出售數(shù)據(jù)是比較愚蠢的方法,數(shù)據(jù)提供的內(nèi)容完全可以創(chuàng)造出新的產(chǎn)品。尤其像o2o 這樣的產(chǎn)品/服務(wù),上游是服務(wù)提供者和資源,下游是用戶,都能夠有價(jià)值可以發(fā)掘。
比如,在紐帶線CRM系統(tǒng)中,通過(guò)商務(wù)社交功能,了解下游企業(yè)間的供求信息,通過(guò)社交,促進(jìn)企業(yè)間的交易合作,定向把企業(yè)間的供求準(zhǔn)確配對(duì),減少企業(yè)的成本,這就充分體現(xiàn)了用戶數(shù)據(jù)產(chǎn)生價(jià)值。這也是他這個(gè)商務(wù)社交功能的核心思想了。
聽(tīng)說(shuō)餓了么在嘗試一項(xiàng)新服務(wù),就是為餐館提供食材。一聽(tīng)嚇一跳,你TM在逗我么?但后來(lái)想想的確是再合理不過(guò)。除了餓了么還有誰(shuí)更能清楚某塊區(qū)域的餐品售賣(mài)數(shù)據(jù)呢?這地方蘿卜白菜賣(mài)得多、有多少量,餓了么清楚得很,跟農(nóng)場(chǎng)談合作,可以很好地把控上游渠道。
這階段的大數(shù)據(jù),已經(jīng)可以成為產(chǎn)品,為用戶直接服務(wù)。
從另一個(gè)角度看,不知道你發(fā)現(xiàn)沒(méi),通過(guò)我們行為數(shù)據(jù)這些元數(shù)據(jù),我們已經(jīng)在慢慢被量化的信息給描述出來(lái)了。看到這些數(shù)字(一年花了多少錢(qián)、在哪方面花的錢(qián)等等)已經(jīng)對(duì)這個(gè)人可以有相對(duì)粗糙的認(rèn)識(shí)了。
而大數(shù)據(jù)最終的形態(tài)開(kāi)始初現(xiàn)。
五、大數(shù)據(jù)應(yīng)用階段三:塑造我們
可能我們對(duì)對(duì)行為數(shù)據(jù)表示不屑。你知道我在網(wǎng)上買(mǎi)了點(diǎn)東西、跟誰(shuí)微信聊了幾句話、去百度隨便查了點(diǎn)東西,就能知道我是什么人了?
別說(shuō),還真可以。只要數(shù)據(jù)保質(zhì)保量。
我們舉個(gè)栗子,你一個(gè)月沒(méi)買(mǎi)避孕套這兩天突然買(mǎi)了三盒,那可能是你要跟異地戀的女朋友見(jiàn)面了;你微信跟異地的某個(gè)妹子聊得特別多、經(jīng)常還視頻,那這大概就是你異地的女朋友;你在百度一直搜東南亞的機(jī)票和旅行攻略,那你可能要去那里玩。
就是這么簡(jiǎn)單的三條元數(shù)據(jù),我們可以大楖推測(cè)出來(lái),最近你要跟女朋友一起去東南亞旅行。
說(shuō)實(shí)話,做這么基礎(chǔ)的邏輯推斷,比下圍棋容易多了。
這是說(shuō)明元數(shù)據(jù)能夠推理信息的邏輯性。而對(duì)于可獲取的元數(shù)據(jù),也越來(lái)越多了。
你打電話時(shí),可以知道你給誰(shuí)打(婦科醫(yī)生?要生孩子了。律師?最近有官司。)
你買(mǎi)東西時(shí),可以知道你的消費(fèi)能力、家庭狀況、喜好甚至性格(高端筆記本?愛(ài)玩游戲。吉他、鋼琴?喜歡音樂(lè)。)
你出門(mén)消費(fèi)時(shí),可以知道你的生活習(xí)慣和個(gè)人情況(健身房?應(yīng)該很健康。經(jīng)常大保???可能身體比較虛。)
你加別人微信時(shí),可以知道你的社交圈子(認(rèn)識(shí)李開(kāi)復(fù)?應(yīng)該不是一般人。通訊錄里都是老師?那可能也是一名教師。)
作為這些產(chǎn)品的數(shù)據(jù)的擁有者,完全不需要派個(gè)私家偵探來(lái)跟蹤你。只需要等你自己乖乖把這些數(shù)據(jù)送上來(lái)。
春節(jié)的時(shí)候,支付寶為什么要和微信爭(zhēng)搶小額支付和社交場(chǎng)景的支付?不是為了那點(diǎn)手續(xù)費(fèi),就是為了它缺失的社交支付這一塊。這塊數(shù)據(jù)的價(jià)值,超乎你想象。
未來(lái)我們每個(gè)人的衣食住行、生活起居,都將有大量的數(shù)據(jù)記錄。我們的行為會(huì)變成一串串?dāng)?shù)字成為可量化的數(shù)據(jù),成為描述我們的信息。我們工作用紐帶線CRM、吃飯用餓了么、打車(chē)用滴滴、搜東西用百度、社交用微信,每一步都被記了下來(lái)。
不信你可以翻出你歷史所有在搜索引擎的搜索記錄來(lái),對(duì)你生活的描述絕對(duì)比你自己的日記都要真實(shí)得多。
這些數(shù)據(jù)將被轉(zhuǎn)換成有價(jià)值的商業(yè)數(shù)據(jù),來(lái)描述你各方面的信息。你喜歡黑色的衣服、你喜歡胸大的妹子、你比較文藝、你有高度近視、你最近剛失戀...... 關(guān)于你,可能這些數(shù)據(jù)比你自己都要清楚。
最終,我們本身就是可以被量化的大數(shù)據(jù)對(duì)象,不存在多層的邏輯了。
這樣的未來(lái)自然有利有弊。利是我們無(wú)處不在享受著大數(shù)據(jù)帶來(lái)的便利,我們看到的每一條廣告都會(huì)是我們自己喜歡的,我們查的每一條搜索記錄都是根據(jù)我們特點(diǎn)來(lái)推薦的,我們?cè)诩雍糜褧r(shí)系統(tǒng)甚至都可以說(shuō)他是不是會(huì)跟我們合得來(lái)。
弊在于,我們的隱私就暴露無(wú)疑。只要數(shù)據(jù)的擁有者想做點(diǎn)壞事,那真的一切皆有可能了。
大數(shù)據(jù)絕不會(huì)止步在為決策僅僅提供幫助,它的終極形態(tài)就是可以用海量的數(shù)據(jù)描述我們一個(gè)個(gè)具體的個(gè)體。當(dāng)達(dá)到這一步時(shí),現(xiàn)在所謂的市場(chǎng)調(diào)研、用戶分析就太小兒科不過(guò)了。
因?yàn)椋?/span>大數(shù)據(jù)已經(jīng)完全能夠塑造出我們了。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
從 CDA LEVEL II 考試題型看 Python 數(shù)據(jù)分析要點(diǎn) 在數(shù)據(jù)科學(xué)領(lǐng)域蓬勃發(fā)展的當(dāng)下,CDA(Certified Data Analyst)認(rèn)證成為眾多從 ...
2025-07-23用 Python 開(kāi)啟數(shù)據(jù)分析之旅:從基礎(chǔ)到實(shí)踐的完整指南 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析已成為各行業(yè)不可或缺的核心能力。而 Pyt ...
2025-07-23鳶尾花判別分析:機(jī)器學(xué)習(xí)中的經(jīng)典實(shí)踐案例 在機(jī)器學(xué)習(xí)的世界里,有一個(gè)經(jīng)典的數(shù)據(jù)集如同引路明燈,為無(wú)數(shù)初學(xué)者打開(kāi)了模式識(shí)別 ...
2025-07-23解析 response.text 與 response.content 的核心區(qū)別 在網(wǎng)絡(luò)數(shù)據(jù)請(qǐng)求與處理的場(chǎng)景中,開(kāi)發(fā)者經(jīng)常需要從服務(wù)器返回的響應(yīng)中提取數(shù) ...
2025-07-22解析神經(jīng)網(wǎng)絡(luò)中 Softmax 函數(shù)的核心作用 在神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程中,激活函數(shù)扮演著至關(guān)重要的角色,它們?yōu)榫W(wǎng)絡(luò)賦予了非線性能力, ...
2025-07-22CDA數(shù)據(jù)分析師證書(shū)考取全攻略 一、了解 CDA 數(shù)據(jù)分析師認(rèn)證 CDA 數(shù)據(jù)分析師認(rèn)證是一套科學(xué)化、專業(yè)化、國(guó)際化的人才考核標(biāo)準(zhǔn), ...
2025-07-22左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 在統(tǒng)計(jì)分析、數(shù)據(jù)建模和科學(xué)研究中,正態(tài)分 ...
2025-07-22你是不是也經(jīng)常刷到別人漲粉百萬(wàn)、帶貨千萬(wàn),心里癢癢的,想著“我也試試”,結(jié)果三個(gè)月過(guò)去,粉絲不到1000,播放量慘不忍睹? ...
2025-07-21我是陳輝,一個(gè)創(chuàng)業(yè)十多年的企業(yè)主,前半段人生和“文字”緊緊綁在一起。從廣告公司文案到品牌策劃,再到自己開(kāi)策劃?rùn)C(jī)構(gòu),我靠 ...
2025-07-21CDA 數(shù)據(jù)分析師的職業(yè)生涯規(guī)劃:從入門(mén)到卓越的成長(zhǎng)之路 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的當(dāng)下,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要來(lái)源,而 CD ...
2025-07-21MySQL執(zhí)行計(jì)劃中rows的計(jì)算邏輯:從原理到實(shí)踐 MySQL 執(zhí)行計(jì)劃中 rows 的計(jì)算邏輯:從原理到實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)的查詢優(yōu)化中 ...
2025-07-21在AI滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數(shù)據(jù)之戰(zhàn),CDA認(rèn)證已成為決定企業(yè)存續(xù)的生死線!據(jù)麥肯錫全球研究院數(shù)據(jù)顯示,AI驅(qū) ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無(wú)望、技能過(guò)時(shí)……當(dāng)職場(chǎng)中年危機(jī)與數(shù)字化浪潮正面交鋒,你是否發(fā)現(xiàn): 簡(jiǎn)歷投了10 ...
2025-07-20CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17