
大數(shù)據(jù)時(shí)代要識(shí)數(shù)
怎么樣才算識(shí)數(shù),怎么才能做到識(shí)數(shù),在羅輯思維的【得到】APP上開設(shè)付費(fèi)專欄《硅谷來信》的吳軍博士給出了自己的理解和建議。
大約從4年前開始,我們就說進(jìn)入了大數(shù)據(jù)時(shí)代,大約從2年前開始,它的應(yīng)用越來越普及,使得我們社會(huì)運(yùn)行的效率(很多大公司賺錢的效率)大大提升。
在思維上,我們也接受了數(shù)據(jù)驅(qū)動(dòng)的思維方式。在這樣一個(gè)時(shí)代,我們都必須做到識(shí)數(shù),而不是看到一個(gè)數(shù)據(jù)后,給出情緒化的反應(yīng)。
幾個(gè)月前,王健林說的“掙一個(gè)億”的小目標(biāo),經(jīng)常被大家拿來調(diào)侃。因?yàn)樵诖蠹业难劾?,一個(gè)億是一個(gè)巨大無比的數(shù)字,甚至近乎一個(gè)天文數(shù)字。即便在人均GDP為五萬元的美國,95%以上的人一輩子是掙不到一億人民幣的。
但是對一個(gè)國家而言,一個(gè)億就是一個(gè)非常小的數(shù)字了。比如中國政府的債務(wù)。根據(jù)國際貨幣基金組織提供的數(shù)據(jù),截止到2016年3月底,是28萬億人民幣。
哇,25萬億耶,是不是永遠(yuǎn)都還不清了?
其實(shí),一個(gè)億,對任何一個(gè)國家來說,都不是什么了不得的數(shù)字,對中國來說,一萬億都只是一小顆花生米而已。因?yàn)橹袊?dāng)時(shí)的GDP大約是68萬億人民幣,債務(wù)占到GDP的41%左右。
41%,都快接近一半了,那這個(gè)債務(wù)水平算不算高呢?
對一個(gè)年收入10萬的家庭來說,40%的債務(wù),即4萬的債務(wù)確實(shí)很高。但是對于中央政府(有些國家叫聯(lián)邦政府),或者像中國這樣可以得到中央撥款支持的地方政府,這個(gè)比例非常低。
美國聯(lián)邦政府的國債到今天累計(jì)已經(jīng)達(dá)到21萬億美元(大約相當(dāng)于146萬億人民幣),占其GDP的125%,這個(gè)還不算州政府借的一些錢呢。
日本的國債占GDP的200%,法國占100%,英國占90%,意大利占130%,并且都在上升。只有德國占73%左右,但是也比中國高得多。
怎么樣,這樣一比較,中國算是非常非常低的吧?其實(shí),越是經(jīng)濟(jì)不太好的國家,債務(wù)水平反而越低。比如俄羅斯,債務(wù)只占了GDP的不到20%。
對中國這樣的國家,什么算是大數(shù)呢?十萬億或者一百萬億!100萬億,用數(shù)字表示就是100,000,000,000,000,也就是1后面14個(gè)零。如果用小時(shí)來度量宇宙的年齡,宇宙到今天大約是100萬億小時(shí)。
我們不僅對大數(shù)字要敏感,對小數(shù)字也應(yīng)如此。吳軍老師說,一位離開Google到某個(gè)電商公司負(fù)責(zé)廣告業(yè)務(wù)的員工有一天跟他抱怨說,他的老板對0.8%的廣告點(diǎn)擊率相當(dāng)不滿意,覺得太低了。當(dāng)時(shí),正好北大光華管理學(xué)院的一位統(tǒng)計(jì)學(xué)教授也在場,他開玩笑地說“你回去和他講,他怎么不上天呢?”
實(shí)際上,0.8%的點(diǎn)擊率對互聯(lián)網(wǎng)展示廣告來說已經(jīng)很高了,因?yàn)檎麄€(gè)行業(yè)的水平大約是0.4%。搜索廣告的點(diǎn)擊率要高很多,但也只有2%。因此,數(shù)據(jù)的大和小完全要看場景,在互聯(lián)網(wǎng)廣告這個(gè)場景下,即使不到1%,也是很大的數(shù)字。
比廣告點(diǎn)擊率更小的數(shù)字是支付系統(tǒng)的出錯(cuò)率。在這個(gè)行業(yè),千分之一都是很大的數(shù)了。因?yàn)檫@個(gè)領(lǐng)域最關(guān)鍵的事控制被欺詐的概率,如果做不到千分之一,就不用在這個(gè)行業(yè)混了。
一般來講,這個(gè)行業(yè)的欺詐率是用基點(diǎn)(也就是萬分之一,即0.01%)來衡量的。大部分信用卡公司和銀行都能講欺詐率控制在幾個(gè)基點(diǎn)這樣的數(shù)量級。支付寶因?yàn)橛写髷?shù)據(jù)支持,大約能做到一個(gè)基點(diǎn)以下,這就使得其他產(chǎn)品難以和他競爭。
與大和小相比,有些時(shí)候“準(zhǔn)確率”(或者比率)這樣的概念更是隨著應(yīng)用場景的不同,標(biāo)準(zhǔn)相差很多。
比如語音識(shí)別,如果準(zhǔn)確率達(dá)不到95%,可用性就不是很好。而對于指紋識(shí)別,如果做不到99%以上,就沒有太大的意義。
我們經(jīng)常看到這樣的洗滌劑廣告,能夠殺死99%的細(xì)菌。事實(shí)上,對那些細(xì)菌特別多的東西,殺死99%是遠(yuǎn)遠(yuǎn)不夠的。因?yàn)榧?xì)菌的繁殖在合適的環(huán)境里繁殖速度很快,一天下來可以繁殖上萬倍。但是,如果一個(gè)過濾器能夠過濾掉99%的PM2.5顆粒,在室內(nèi)大致可以滿意了。
那我們怎么知道每一個(gè)領(lǐng)域數(shù)字的大和小呢?怎樣才能不被人忽悠呢?吳軍老師說可以從三個(gè)層次培養(yǎng)自己對數(shù)字的敏感性。
首先,不要一看到別人給的數(shù)字,就被唬住了。對它既要關(guān)注,也要留個(gè)心眼。要牢記數(shù)字的大小和場景密切相關(guān)。
其次,對于很多事情要有大致的概念,不需要了解細(xì)節(jié),但在數(shù)量級上要有常識(shí)。比如我們在報(bào)紙上經(jīng)常看到“豪宅”兩個(gè)字,標(biāo)題黨常常用它來吸引眼球。其實(shí)只要把那個(gè)價(jià)錢放到一個(gè)地區(qū)和當(dāng)?shù)氐姆績r(jià)或者收入水平做一個(gè)對比,就能大致做出判斷了。
數(shù)量級的概念也就是10的多少次方,一個(gè)數(shù)量級的差距就是差10倍。
最后,我們看到一個(gè)數(shù)字,在下結(jié)論之前,最好問一下自己,它的參照物是什么,凡事大小多少都需要有參照物,在互聯(lián)網(wǎng)發(fā)達(dá)的今天,這些參照物并不難找。
對數(shù)字敏感,很多時(shí)候是我們不吃虧,乃至事業(yè)成功的基礎(chǔ)。
最后,拜托你幫我個(gè)忙,如果你覺得這篇文章對你有所啟發(fā),歡迎轉(zhuǎn)發(fā)到朋友圈讓你的朋友們也看看。謝謝你!
我把每一次的寫作都當(dāng)作一次分享的機(jī)會(huì),希望借此遇見更好的自己。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03