
什么是大數(shù)據(jù)時(shí)代的思維
一百多年前,汽車(chē)行業(yè)是第一個(gè)真正引入大規(guī)模生產(chǎn)概念的行業(yè)。那些以前買(mǎi)不起車(chē)的美國(guó)工薪階層,突然承擔(dān)得起汽車(chē)這個(gè)富人的專(zhuān)屬玩具了。福特T型車(chē)讓成千上萬(wàn)美國(guó)家庭擁有汽車(chē)。但大規(guī)模制造也有其局限性,福特先生說(shuō)過(guò),你可以買(mǎi)到各種色彩的車(chē),但紅色、綠色都不可能,只能是黑色。大規(guī)模生產(chǎn)讓數(shù)以百計(jì)的人買(mǎi)得起商品,但商品本身卻是一模一樣的。
我們面臨這樣一個(gè)矛盾:手工制作的產(chǎn)品漂亮無(wú)比卻非常昂貴;與此同時(shí),量產(chǎn)化的商品價(jià)格低廉,但無(wú)法完全滿(mǎn)足消費(fèi)者的需求。
我認(rèn)為下一波的改革是大規(guī)模定制,為大量客戶(hù)定制產(chǎn)品和服務(wù),成本低、又兼具個(gè)性化。比如消費(fèi)者希望他買(mǎi)的車(chē)有紅色、綠色,廠商有能力滿(mǎn)足要求,但價(jià)格又不至于像手工制作那般讓人無(wú)法承擔(dān)。
因此,在廠家可以負(fù)擔(dān)得起大規(guī)模定制帶去的高成本的前提下,要真正做到個(gè)性化產(chǎn)品和服務(wù),就必須對(duì)客戶(hù)需求有很好的了解,這背后就需要依靠大數(shù)據(jù)技術(shù)。
數(shù)據(jù)能告訴我們,每一個(gè)客戶(hù)的消費(fèi)傾向,他們想要什么,喜歡什么,每個(gè)人的需求有哪些區(qū)別,哪些又可以被集合到一起來(lái)進(jìn)行分類(lèi)。大數(shù)據(jù)是數(shù)據(jù)數(shù)量上的增加,以至于我們能夠?qū)崿F(xiàn)從量變到質(zhì)變的過(guò)程。舉例來(lái)說(shuō),這里有一張照片,照片里的人在騎馬。這張照片每一分鐘,每一秒都要拍一張,但隨著處理速度越來(lái)越快,從1分鐘一張到1秒鐘1張,突然到1秒鐘10張后,就產(chǎn)生了電影。當(dāng)數(shù)量的增長(zhǎng)實(shí)現(xiàn)質(zhì)變時(shí),就一張照片變成了一部電影。
讓我來(lái)告訴大家,美國(guó)有一家創(chuàng)新企業(yè)Decide.com。它可以幫助人們做購(gòu)買(mǎi)決策,告訴消費(fèi)者什么時(shí)候買(mǎi)什么產(chǎn)品,什么時(shí)候買(mǎi)最便宜。預(yù)測(cè)產(chǎn)品的價(jià)格趨勢(shì)。這家公司背后的驅(qū)動(dòng)力就是大數(shù)據(jù)。他們?cè)谌蚋鞔缶W(wǎng)站上搜集數(shù)以十億計(jì)的數(shù)據(jù),然后幫助數(shù)以十萬(wàn)計(jì)的用戶(hù)省錢(qián),為他們的采購(gòu)找到最好的時(shí)間,提高生產(chǎn)率,降低交易成本,為終端的消費(fèi)者帶去更多價(jià)值。
在這類(lèi)模式下,盡管一些零售商的利潤(rùn)會(huì)進(jìn)一步受擠壓,但從商業(yè)本質(zhì)上來(lái)講,可以把錢(qián)更多地放回到消費(fèi)者的口袋里,讓購(gòu)物變得更理性。這是依靠大數(shù)據(jù)催生出的一項(xiàng)全新產(chǎn)業(yè)。這家為數(shù)以十萬(wàn)計(jì)的客戶(hù)省錢(qián)的公司,在幾個(gè)星期前,被ebay以高價(jià)收購(gòu)。
再舉一個(gè)例子,SWIFT是全球最大的支付平臺(tái),在該平臺(tái)上的每一筆交易都可以進(jìn)行大數(shù)據(jù)的分析。他們可以預(yù)測(cè)一個(gè)經(jīng)濟(jì)體的健康性和增長(zhǎng)性。比如,該公司現(xiàn)在為全球性客戶(hù)提供經(jīng)濟(jì)指數(shù),這又是一個(gè)大數(shù)據(jù)服務(wù)。
大數(shù)據(jù)有三大特點(diǎn): 更多,更亂,但內(nèi)部有關(guān)系可循。
如果拍一張照片,我需要對(duì)著某一個(gè)人,好比說(shuō)拍陳部長(zhǎng)的照片,如果焦點(diǎn)只對(duì)準(zhǔn)他,那其他的人物在照片里就會(huì)模糊掉。我會(huì)得到陳部長(zhǎng)的所有信息,但是其他觀眾的信息就過(guò)濾掉了。我們采集信息的時(shí)候也要做決策,到底要回答什么問(wèn)題,采集什么數(shù)據(jù),因?yàn)橐坏?shù)據(jù)采集完畢,就無(wú)法重新問(wèn)另外的問(wèn)題。
但今天我們已經(jīng)擁有全新的照相技術(shù)了,一張照片里可以把對(duì)角所有事物,包括所有的數(shù)據(jù)、光線都會(huì)被拍攝進(jìn)去。這樣,我任意點(diǎn)一個(gè)地方,它都能變得清晰。
為什么要這么做呢?方便決策。
我可以在照片生成之后再?zèng)Q定我究竟要什么,因?yàn)檫@些數(shù)據(jù)包含所有的答案。不要把自己限制于眼前的問(wèn)題,要為有前瞻性,把其他有可能出現(xiàn)的問(wèn)題也給囊括進(jìn)去。這是一個(gè)非常創(chuàng)新的辦法,同時(shí)很清晰地告訴我們大數(shù)據(jù)能夠做什么。我可以跟大家分享一個(gè)秘密,如果你把照相機(jī)拿出來(lái)仔細(xì)看,可以看到這是中國(guó)制造。
在擁有如此多的數(shù)據(jù)以后,接下來(lái)我們面對(duì)的數(shù)據(jù)質(zhì)量問(wèn)題。
為了避免混亂,我們需要找到數(shù)據(jù)之間的關(guān)聯(lián)性。
舉個(gè)實(shí)際生活中的例子,大約20年前,亞馬遜剛成立時(shí),杰夫·貝索斯讓50個(gè)書(shū)評(píng)員來(lái)為他賣(mài)書(shū),他意識(shí)到不僅僅可以請(qǐng)人來(lái)寫(xiě)書(shū)評(píng),還可以用數(shù)據(jù)技術(shù)來(lái)提供圖書(shū)推薦。起初他使用的是小數(shù)據(jù),不是大數(shù)據(jù),把客戶(hù)進(jìn)行分類(lèi),比如說(shuō)有人對(duì)中國(guó)旅游或者是對(duì)園藝感興趣,系統(tǒng)會(huì)自動(dòng)提供推薦。他的同事告訴他,剛剛開(kāi)始使用這個(gè)數(shù)據(jù)推薦時(shí),使用體驗(yàn)并不好;在進(jìn)一步分析后,亞馬遜決定不對(duì)人進(jìn)行分類(lèi),而是對(duì)用戶(hù)的需求分類(lèi)。這個(gè)做法做法非常成功,以至于到今天,推薦系統(tǒng)為亞馬遜帶去30%的銷(xiāo)售收入。
這就是數(shù)據(jù)收集和再處理。亞馬遜有交易數(shù)據(jù),每買(mǎi)一本書(shū)就是一個(gè)交易,然后對(duì)這個(gè)數(shù)據(jù)進(jìn)行分析。但今天我們已不再滿(mǎn)足于交易數(shù)據(jù)了,轉(zhuǎn)而收集起溝通數(shù)據(jù)。你看了某一個(gè)書(shū)評(píng)、某一個(gè)交流會(huì)給商家更多的信息和細(xì)節(jié)。
同時(shí),大數(shù)據(jù)也重構(gòu)了傳統(tǒng)零售業(yè),是未來(lái)零售業(yè)變革的催化劑。比如使用谷歌眼鏡,消費(fèi)者不需要屏幕了,因?yàn)橄乱淮难坨R會(huì)更好地理解消費(fèi)者看到什么,知道如何更好地抓住人們的視線。對(duì)于零售商而言,消費(fèi)者眼中看到的信息是極具價(jià)值的資產(chǎn)。賣(mài)家就可以了解大家在看什么樣的廣告,什么樣的產(chǎn)品,在路過(guò)櫥窗時(shí)究竟看了一些什么。
數(shù)據(jù)的產(chǎn)生和收集本身并沒(méi)有直接產(chǎn)生服務(wù),最具價(jià)值的部分在于:當(dāng)這些數(shù)據(jù)在收集以后,會(huì)被用于不同的目的,數(shù)據(jù)被重新再次使用。
大數(shù)據(jù)的一大優(yōu)點(diǎn)就是數(shù)據(jù)可以被重復(fù)使用。比方說(shuō)這家公司實(shí)時(shí)車(chē)輛交通數(shù)據(jù)采集商Inrix,該公司目前有1億個(gè)手機(jī)端用戶(hù)。Inrix可以幫助你開(kāi)車(chē),避開(kāi)堵車(chē),為司機(jī)呈現(xiàn)路的熱量圖,紅的就表面堵車(chē)。如果只提供數(shù)據(jù),這個(gè)產(chǎn)品沒(méi)什么特色,
但值得一提的是,Inrix并沒(méi)有用交警的數(shù)據(jù),這個(gè)軟件的每位用戶(hù)在使用過(guò)程中會(huì)給服務(wù)器發(fā)送實(shí)時(shí)數(shù)據(jù),比如走的多快,走到哪里,這樣每個(gè)客戶(hù)都是探測(cè)器。
這里還有更大的秘密,Inrix可以重復(fù)使用數(shù)據(jù)。比如它了解到周末堵車(chē)時(shí),哪里有堵車(chē)哪里有更好的銷(xiāo)售,他們就可以把這樣的數(shù)據(jù)提供給投資公司,投資公司根據(jù)這些數(shù)據(jù)對(duì)零售業(yè)再投資,這樣的服務(wù)以前是從來(lái)不存在的。
那么,大數(shù)據(jù)可以如何為創(chuàng)新企業(yè)所用?
你覺(jué)得之前成立新公司需要大筆資金,但事實(shí)并非如此。Inrix一開(kāi)始并沒(méi)有錢(qián),如果你想在大數(shù)據(jù)時(shí)代獲得成功,你已經(jīng)不需要大的生產(chǎn)基地,大的倉(cāng)庫(kù)了。你只需數(shù)據(jù),只要擁有數(shù)據(jù),對(duì)其進(jìn)行分析就可以了。有云存儲(chǔ)的話,這個(gè)成本就更低。Inrix在成立之初根本沒(méi)有服務(wù)器和電腦,他們只是租用了云服務(wù),也不需要很多的啟動(dòng)資金,他們只是有這樣一個(gè)產(chǎn)品想法。
大數(shù)據(jù)時(shí)代的思維方式是:每天早上起來(lái)想一下,這么多數(shù)據(jù)我能用來(lái)干什么,這些價(jià)值在哪里可以找到,能不能找到一個(gè)別人以前都沒(méi)有做過(guò)的事情。你的想法和思路,是最重要的資產(chǎn)。
大數(shù)據(jù)的思維方式也可以幫助政府為大家提供更好更有效的服務(wù),好比說(shuō)我們可以通過(guò)大數(shù)據(jù)來(lái)確定哪些地方會(huì)有火災(zāi)。以前防火檢查員只有13%的時(shí)間可以準(zhǔn)備預(yù)測(cè),現(xiàn)在他們找到火災(zāi)隱患的概率達(dá)到了70%,比以前提高了6倍。將效率提高6倍是一個(gè)巨大無(wú)比的進(jìn)步,未來(lái)的公共服務(wù)業(yè)可以由此獲得更多便利。
Target是一家非常大的美國(guó)零售公司,他們已有大數(shù)據(jù)的分析。
有一天,一個(gè)電話打進(jìn)來(lái),是一位非常生氣的客戶(hù),這個(gè)客戶(hù)說(shuō)公司送給他17歲的女兒一個(gè)折扣券,這個(gè)產(chǎn)品是尿布或者是避孕藥,這位客戶(hù)說(shuō):“我17歲的女孩子根本不需要,我需要你來(lái)道歉?!睅滋煲院?,客戶(hù)自己跑來(lái)道歉,他說(shuō)你說(shuō)的很準(zhǔn),我的女兒真的懷孕了。因?yàn)閼言械呐詴?huì)有不同的生活習(xí)慣,會(huì)買(mǎi)不同的東西,我們自己有時(shí)候都不知道他們已經(jīng)懷孕了,而Target反而知道了。
這家公司就用這些信息為客戶(hù)推薦產(chǎn)品,然后給折扣券。為什么要講這個(gè)例子呢?因?yàn)槊绹?guó)很多客戶(hù)感到緊張,Target有這樣的能力來(lái)了解他們的生活中究竟發(fā)生了一些什么。
這意味著大數(shù)據(jù)的另一個(gè)關(guān)鍵點(diǎn),要提高客戶(hù)對(duì)你的信任。
舉個(gè)例子,大數(shù)據(jù)時(shí)代美國(guó)運(yùn)通有這樣一個(gè)功能,你給他們打電話的話,他們會(huì)知道你是誰(shuí),好比說(shuō)你的電話號(hào)碼跟你的姓名相關(guān)。如果在電話里說(shuō):你好嗎?維克托先生,我能為你做什么,這會(huì)嚇著客戶(hù),因?yàn)樗恢罏槭裁茨阒浪拿?。營(yíng)造信任很重要。我相信你的過(guò)程中,也希望你們相信我,所以我們做大數(shù)據(jù)分析的時(shí)候,客戶(hù)需要能夠信任服務(wù)供應(yīng)商,而服務(wù)供應(yīng)商也需要表現(xiàn)出來(lái)為什么他是值得信任的。
這樣一個(gè)信任也不應(yīng)該被打碎,企業(yè)應(yīng)該要知道哪些事情可以做,哪些事情不能做,客戶(hù)的信任將是最珍貴的資產(chǎn)。
什么樣的服務(wù)行業(yè)會(huì)從大數(shù)據(jù)中獲益?
其實(shí)所有的服務(wù)行業(yè)都可能從中獲益,即便是你覺(jué)得和大數(shù)據(jù)沒(méi)有關(guān)系的也可以從中獲益,好比說(shuō)醫(yī)療服務(wù)、教育、學(xué)習(xí)。
我正在寫(xiě)一本新的書(shū),明年的上半年會(huì)出版,還是大數(shù)據(jù)以及相關(guān)的服務(wù)業(yè)。明年你就知道了,這本書(shū)里面會(huì)提到大數(shù)據(jù)對(duì)服務(wù)業(yè)很重要,因?yàn)榉?wù)業(yè)將會(huì)面對(duì)巨大的改變,這不僅僅是效率,大數(shù)據(jù)會(huì)為各行各業(yè)帶來(lái)效率,而大數(shù)據(jù)對(duì)于服務(wù)業(yè)來(lái)說(shuō)不僅僅是效率,我們更多看到將是創(chuàng)新。我們會(huì)有越來(lái)越多的創(chuàng)新想法,來(lái)提供新的產(chǎn)品和服務(wù),這樣的話可以讓經(jīng)濟(jì)更好地發(fā)展,我們以前是從來(lái)沒(méi)有看到過(guò)的。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11