
數(shù)據(jù)的秘密(上)為什么要關(guān)注數(shù)據(jù)
由于科技的進(jìn)步,以及數(shù)據(jù)「數(shù)字化」地存儲,使得現(xiàn)代人類可以獲得海量的數(shù)據(jù)。而有了這些海量的數(shù)據(jù)之后,借助于一些數(shù)據(jù)分析工具和方法,我們就可以從數(shù)據(jù)中找到社會運(yùn)行的「秘密」。
在工作中,借助這些「秘密」,我們有可能發(fā)現(xiàn)商業(yè)中的新機(jī)會,也可能驗(yàn)證或推翻自己的一些猜想。數(shù)據(jù)分析,使得我們對「秘密」的探索有了一個(gè)可靠的方法。
在本文中,我想分享一下工作中學(xué)到的發(fā)現(xiàn)數(shù)據(jù)中秘密的心得。
我們先看看 稻盛和夫 挽救日航的故事吧。他的這段傳奇經(jīng)歷曾經(jīng)被很多媒體報(bào)道,我將故事摘要如下:
2010 年 1 月 19 日,日本航空公司申請破產(chǎn)保護(hù)。日航有 58 年歷史,一度被視作日本戰(zhàn)后經(jīng)濟(jì)繁榮的驕傲象征。
2010 年 2 月 1 日,受日本首相邀請,稻盛和夫答應(yīng)出日航董事長,一年之后,日航扭虧為盈,利潤是對手全日空的三倍。 僅僅用了一年時(shí)間,日航做到了三個(gè)第一,一個(gè)是利潤世界第一,一個(gè)是準(zhǔn)點(diǎn)率世界第一,一個(gè)是服務(wù)水平世界第一。
在日航重新上市之后,稻盛和夫分享了他 挽救日航的秘密。這里面涉及的內(nèi)容很多,其中有很重要的一條,就是稻盛和夫非常重視日航具體的運(yùn)營數(shù)據(jù),他花了很大的力氣來優(yōu)化數(shù)據(jù)的獲取,從而能夠?qū)θ蘸降默F(xiàn)狀進(jìn)行判斷。
稻盛和夫是這樣說的:
我擔(dān)任董事長后,最為吃驚的是,公司的各項(xiàng)統(tǒng)計(jì)數(shù)據(jù)不僅不全,而且統(tǒng)計(jì)時(shí)間很長很慢,往往需要 3 個(gè)月之后才能搞全數(shù)據(jù),以至于經(jīng)營者無法迅速掌握公司的運(yùn)營情況。 所以,在對企業(yè)內(nèi)部進(jìn)行改革時(shí),我特別關(guān)注統(tǒng)計(jì)工作。經(jīng)過改革,現(xiàn)在各個(gè)部門的數(shù)據(jù)做到即有即報(bào),公司詳盡的經(jīng)營報(bào)告,做到了一個(gè)月內(nèi)完成。
如果把日航看過一個(gè)生病了的病人,稻盛和夫的做法其實(shí)和現(xiàn)代醫(yī)學(xué)的做法類似,就是首先進(jìn)行各項(xiàng)檢查,獲得病人的身體指標(biāo)信息,有了這些檢查數(shù)據(jù),我們就可以利用各種基于數(shù)據(jù)的經(jīng)驗(yàn),來進(jìn)行病情診斷和治療。所有的治療手段又可以通過再次的檢查來驗(yàn)證,從而進(jìn)一步改進(jìn)治療方法。
人做為一個(gè)生命體,全身密布的神經(jīng)負(fù)責(zé)著各種信息的傳遞,所以我們的大腦能夠接受到各種信息,從而做出決策,餓了吃飯,冷了加衣服,保證著我們身體的健康。
而企業(yè)沒有天生的神經(jīng)系統(tǒng),所以數(shù)據(jù)收集和分析就顯得異常重要了。日航作為一家運(yùn)營了 50 多年的公司,居然在這方面做得非常差,難怪會進(jìn)入破產(chǎn)的邊緣。而稻盛和夫用的辦法也很簡單,先讓數(shù)據(jù)能夠收集起來,那么后續(xù)依據(jù)數(shù)據(jù)做決策就不再那么困難了。
我剛畢業(yè)的時(shí)候加入的是網(wǎng)易公司,當(dāng)時(shí)負(fù)責(zé)做網(wǎng)易郵箱的底層 Restful Api。當(dāng)時(shí)我們部門的老大郭常圳常常講要「monitor your data」,我當(dāng)時(shí)作為一個(gè)應(yīng)屆生,剛開始對這個(gè)口號不太理解。我當(dāng)時(shí)想:數(shù)據(jù)當(dāng)然是重要的,但是也不值得老掛在嘴邊講吧?但是后來我才慢慢發(fā)現(xiàn),這其實(shí)確實(shí)非常重要。
作為程序員,我們開發(fā)一個(gè)后臺服務(wù),大家有沒有測試過以下數(shù)據(jù):
當(dāng)時(shí)郭常圳帶領(lǐng)我們,將我們做的每一個(gè)服務(wù)都進(jìn)行了詳細(xì)的壓力測試,我們對于我們的服務(wù)承受力有著非常詳細(xì)的數(shù)據(jù)測試結(jié)果。
這一點(diǎn)每個(gè)公司都做到了嗎?其實(shí)不是。我還記得我們后來和網(wǎng)易的網(wǎng)站部共同開發(fā)網(wǎng)易微博后臺,當(dāng)時(shí)我們因?yàn)橐獙⑧]箱微博和網(wǎng)易微博數(shù)據(jù)合并,需要進(jìn)行在線的數(shù)據(jù)遷移。我當(dāng)時(shí)負(fù)責(zé)數(shù)據(jù)遷移工作,在我向網(wǎng)站部詢問我應(yīng)該用多大的請求壓力來遷移數(shù)據(jù)時(shí),對方只是回答:“盡量慢點(diǎn)”。
我當(dāng)時(shí)就傻掉了,誰能告訴我什么叫 “盡量慢點(diǎn)”?于是我只能小心翼翼,一點(diǎn)一點(diǎn)地增加壓力,最后我發(fā)現(xiàn),他們的數(shù)據(jù)庫其實(shí)一點(diǎn)壓力都沒有,我根本就不用控制壓力都不會影響線上服務(wù)。但是,由于他們「monitor your data」做得不好,所以他們對任何可能的壓力都心懷恐懼,不敢亂動。
后來我也私下和他們求證了一下,他們果然完全不知道他們的服務(wù)器能夠承受多少 QPS。大家也可以問問自己公司的服務(wù)器同事,自己的服務(wù)器能夠承受的 QPS 是多少,就知道自己的公司在這一點(diǎn)上做得好不好了。
而現(xiàn)在,數(shù)據(jù)驅(qū)動的思維更加深入到互聯(lián)網(wǎng)開發(fā)中了。因此,國外的 New Relic 這類公司,才可以獲得上億美金的估值。 New Relic 的工作原理是放很多小的探針到你的程序代碼中,這些探針收集到非常詳細(xì)的程序運(yùn)行數(shù)據(jù),就可以為你優(yōu)化服務(wù)器提供有效的建議。
如果說技術(shù)上的「monitor your data」只是影響服務(wù)穩(wěn)定性的話,那么產(chǎn)品上的「monitor your data」就會決定產(chǎn)品的成敗了。
我認(rèn)為產(chǎn)品上的數(shù)據(jù)分析有以下作用。
在互聯(lián)網(wǎng)行業(yè)工作這么多年,我發(fā)現(xiàn)了一個(gè)秘密,就是任何新的互聯(lián)網(wǎng)產(chǎn)品,都不是靠用戶調(diào)研或數(shù)據(jù)分析來的。
因?yàn)橛脩粽{(diào)研非常難做,稍不注意就會被別的因素影響,所以喬布斯曾經(jīng)說他從來不做用戶調(diào)研。而數(shù)據(jù)分析對于一個(gè)新產(chǎn)品來說,會陷入無米之炊的尷尬境地。
所以很多新產(chǎn)品的第一版都是創(chuàng)始人或產(chǎn)品經(jīng)理「拍腦袋」的產(chǎn)物。這一點(diǎn)其實(shí)是非?,F(xiàn)實(shí)的做法。「拍腦袋」依賴于創(chuàng)始人的經(jīng)驗(yàn),如果創(chuàng)始人經(jīng)驗(yàn)豐富,那么很可能產(chǎn)品對了 7 分,錯了 3 分。另外那 3 分的錯誤假設(shè),可以在產(chǎn)品上線后迅速通過數(shù)據(jù)來驗(yàn)證,從而迭代修正這些假設(shè)。
所以數(shù)據(jù)分析對于產(chǎn)品來說,第一大作用就是驗(yàn)證(或推翻)產(chǎn)品經(jīng)理的假設(shè),從而使產(chǎn)品能夠得到快速迭代改進(jìn)。
很多時(shí)候,數(shù)據(jù)分析不光會得到你的產(chǎn)品本身的狀態(tài),還會發(fā)現(xiàn)一些新的機(jī)會。借助這些新發(fā)現(xiàn),我們對產(chǎn)品產(chǎn)生新的認(rèn)識。
拿我們的創(chuàng)業(yè)產(chǎn)品「小猿搜題」來說,我們一直在監(jiān)控它的 NPS(凈推薦值) 數(shù)據(jù)。為了把數(shù)據(jù)分析得更加細(xì)致,我們把打 NPS 0 分的用戶行為進(jìn)行了抽樣分析,最終我們發(fā)現(xiàn),雖然我們的 slogon 叫「初高中拍照搜題利器」,但是卻有大量的小學(xué)生用戶在使用我們的產(chǎn)品。
我們并沒有為小學(xué)生做任何的產(chǎn)品上的優(yōu)化,所以造成了這部分用戶沒有被很好的滿足。所以,我們最近在內(nèi)容和搜索算法上針對小學(xué)生做了特別優(yōu)化,同時(shí)將產(chǎn)品的 slogon 修改成了「中小學(xué)拍照搜題利器」。
如果沒有細(xì)致的數(shù)據(jù)分析,我們可能就錯過了幾千萬的潛在用戶。
一個(gè)產(chǎn)品會有非常多的指標(biāo),日活,月活,留存率,年齡分布,用戶使用習(xí)慣等,產(chǎn)品經(jīng)理應(yīng)該對這些指標(biāo)了如指掌,在對這些數(shù)據(jù)熟悉之后,產(chǎn)品經(jīng)理就可以發(fā)現(xiàn)數(shù)據(jù)中的變化規(guī)律或異常點(diǎn),從而對產(chǎn)品帶來一些改進(jìn)。
在這一點(diǎn)上,我喜歡講林彪的一個(gè)故事。
1948 年遼沈戰(zhàn)役開始之后,在東北野戰(zhàn)軍前線指揮所里面,每天深夜都要進(jìn)行例常的 “每日軍情匯報(bào)”:由值班參謀讀出下屬各個(gè)縱隊(duì)、師、團(tuán)用電臺報(bào)告的當(dāng)日戰(zhàn)況和繳獲情況。
那幾乎是重復(fù)著千篇一律的枯燥無味的數(shù)據(jù):每支部隊(duì)殲敵多少、俘虜多少;繳獲的火炮、車輛多少、槍支、物資多少。
司令員林彪的要求很細(xì),俘虜要分清軍官和士兵,繳獲的槍支,要統(tǒng)計(jì)出機(jī)槍、長槍、短槍;擊毀和繳獲尚能使用的汽車,也要分出大小和類別。
經(jīng)過一天緊張的戰(zhàn)斗指揮工作,人們都非常疲勞。整個(gè)作戰(zhàn)室里面估計(jì)只有定下這個(gè)規(guī)矩的司令員林彪本人、還有那個(gè)讀電報(bào)的倒霉參謀在用心留意。
1948 年 10 月 14 日,東北野戰(zhàn)軍以迅雷不及掩耳之勢,僅用了 30 小時(shí)就攻克了對手原以為可以長期堅(jiān)守的錦州之后,不顧疲勞,揮師北上與從沈陽出援的敵精銳廖耀湘基團(tuán)二十余萬在遼西相遇,一時(shí)間形成了混戰(zhàn)。戰(zhàn)局瞬息萬變,誰勝誰負(fù)實(shí)難預(yù)料。
在大戰(zhàn)緊急中,林彪無論有多忙,仍然堅(jiān)持每晚必作的 “功課”。一天深夜,值班參謀正在讀著下面某師上報(bào)的其下屬部隊(duì)的戰(zhàn)報(bào)。說他們下面的部隊(duì)碰到了一個(gè)不大的遭遇戰(zhàn),殲敵部分、其余逃走。與其它之前所讀的戰(zhàn)報(bào)看上去并無明顯異樣,值班參謀就這樣讀著讀著,林彪突然叫了一聲 “停!” 他的眼里閃出了光芒,問:“剛才念的在胡家窩棚那個(gè)戰(zhàn)斗的繳獲,你們聽到了嗎?”
大家?guī)е獾哪樕铣霈F(xiàn)了茫然,因?yàn)槿绱藨?zhàn)斗每天都有幾十起,不都是差不多一模一樣的枯燥數(shù)字嗎?林彪掃視一周,見無人回答,便接連問了三句:
“為什么那里繳獲的短槍與長槍的比例比其它戰(zhàn)斗略高”? “為什么那里繳獲和擊毀的小車與大車的比例比其它戰(zhàn)斗略高”? “為什么在那里俘虜和擊斃的軍官與士兵的比例比其它戰(zhàn)斗略高”?
人們還沒有來得及思索,等不及的林彪司令員大步走向掛滿軍用地圖的墻壁,指著地圖上的那個(gè)點(diǎn)說:“我猜想,不,我斷定!敵人的指揮所就在這里!”
隨后林彪口授命令,追擊從胡家窩棚逃走的那部分?jǐn)橙?,并?jiān)決把他們打掉。各部隊(duì)要采取分割包圍的辦法,把失去指揮中樞后會變得混亂的幾十萬敵軍切成小塊,逐一殲滅。
廖耀湘對自己靜心隱蔽的精悍野戰(zhàn)司令部那么快就被發(fā)現(xiàn)、打掉,覺得實(shí)在不可思議,認(rèn)為那是一個(gè)偶然事件,輸?shù)貌桓市?。?dāng)他得知林彪是如何得出判斷之后說,“我服了,敗在他手下,不丟人?!?/span>
有些時(shí)候,一個(gè)數(shù)據(jù)中的異常點(diǎn),就是一次決定性的機(jī)會。而產(chǎn)品經(jīng)理只有做好「monitor your data」,才能抓住這樣的機(jī)會。
有一些產(chǎn)品,產(chǎn)品經(jīng)理自己就是目標(biāo)用戶,所以可以比較容易用同理心來分析出用戶的需求。但是像我們猿題庫這次創(chuàng)業(yè),目標(biāo)用戶都是初高中生,我怎么知道這些 00 后的需求、想法和興趣愛好?
除了多和他們聊天,多用他們喜歡的產(chǎn)品外,分析他們的行為數(shù)據(jù)也至關(guān)重要。郭常圳常常說:“我們做產(chǎn)品要有場景化思維,要還原用戶當(dāng)時(shí)真實(shí)的使用場景”。而通過分析一些用戶使用數(shù)據(jù),就有助于我們還原用戶使用場景。
這種事情做得多了,我們就會更加了解用戶了,慢慢就形成了產(chǎn)品的直覺。
關(guān)注數(shù)據(jù)和數(shù)據(jù)分析能力,是互聯(lián)網(wǎng)時(shí)代生存的基本技能。不管是做產(chǎn)品還是做技術(shù),養(yǎng)成「monitor your data」的習(xí)慣,都可以讓你將工作做得更加出色。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時(shí)代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08