
我所理解的統(tǒng)計思維
美國著名的小說家Mark Twain(馬克吐溫)在1907年的自傳里,引用了曾任英國首相的Benjamin Disraeli的一段話:
There are three kinds of lies: lies, damned lies, and statistics.
由于Mark Twain的高知名度,這句話因他說了之后,便廣為流傳了。
大家都學過多年數(shù)學,對于為什么要學數(shù)學,原因之一當然是生活上,及專業(yè)上,會用到一些數(shù)學,也就是數(shù)學可視為一種工具。而一個數(shù)學精通的人,則往往具有邏輯性強,計算精準等特征。那么統(tǒng)計學呢?
統(tǒng)計學現(xiàn)在一方面越來越重要,人們在做決策時,非有統(tǒng)計不可,把統(tǒng)計當護身符。同時也有像Mark Twain這樣的對統(tǒng)計嗤之以鼻。即使在學術界,不少人也都認為統(tǒng)計不過就是數(shù)學的一部分而已;但更多的統(tǒng)計學家則認為并一再強調,統(tǒng)計與數(shù)學是完全不一樣的。
我們可能比較容易感受到什么是具有經(jīng)濟頭腦,什么是具有文學細胞,以及什么是具有音樂素養(yǎng)。那什么是具有統(tǒng)計頭腦?統(tǒng)計細胞?以及統(tǒng)計素養(yǎng)呢?就不易講得明白了。這篇文章就試圖通過闡釋統(tǒng)計思維的方式,來談談上述幾個問題。
1、正確理解統(tǒng)計思維的重要性
讓我們先來看一個例子。1985年11月,一位美國學者Gary Taylor在英國牛津大學的一圖書館找到了一首詩(姑且稱為“Taylor詩”好了),引發(fā)了一場英美研究莎士比亞文學作品的學者們的口水大戰(zhàn),爭論的焦點就是此詩是否為莎士比亞所作。
不少專家認為這首“Taylor詩”,不論是用字遣詞,還是韻味風格,都迥異于莎士比亞其他作品。論戰(zhàn)兩個月后,1986年1月24日出版的Science 雜志刊登了一篇“莎士比亞的新詩:向統(tǒng)計學致敬”(Shakespeare's new poem: an ode to statistics)的文章,介紹兩位統(tǒng)計學者Efron與Thisted如何以統(tǒng)計方法鑒定這首“Taylor詩”是否為莎士比亞所作的過程。
Efron與Thisted的方法是這樣的:每個人都有其各自的用字習慣,特別是對于生僻字,每個作者使用的習慣差異可能更大。在莎士比亞已知的總作品中,共有884,647個字,其中有31,534個相異字。這些相異字中,有14,376個字從頭到尾只出現(xiàn)過1次,有4,343個字只出現(xiàn)2次。出現(xiàn)幾次的字都被計算出來。那些在總作品中, 出現(xiàn)頻率較低的,就是莎士比亞的生僻字。依據(jù)這些數(shù)據(jù),假設這首共429個字的“Taylor詩”為莎士比亞所寫,他們估計會有幾個字,在總作品中從未出現(xiàn)(也就是新字),只出現(xiàn)1次,2次, ……,一直到曾出現(xiàn)99次,都給出估計值。實際情況與估計非常吻合。
這樣做還不夠,會不會當時代的詩人用字習慣都差不多?于是,兩人又找了三位大致與莎士比亞同時代的詩人,各取其一首詩,及另取四首莎士比亞的詩,與這首泰勒詩做比較。經(jīng)過3種統(tǒng)計檢定發(fā)現(xiàn)對前三首,若假設為莎士比亞的作品,罕用字出現(xiàn)次數(shù)之實際值與估計值皆不吻合。而所挑選的四首莎士比亞的詩,雖偶有不合,但總的來說是可接受的。Efron及Thisted說,他們的分析并無法完全證明“Taylor詩”為莎士比亞所寫,但在罕用字之使用情況,如此與莎士比亞的總作品吻合,確實令人驚訝。
一場文學上的爭論,經(jīng)統(tǒng)計學家發(fā)聲后迅速平息,難怪要向統(tǒng)計學致敬了。運用統(tǒng)計方法來做決策,反映的是一種客觀及合理的思維。與其主觀的爭論風格相同否,還不如以客觀的統(tǒng)計方法來判定。但如何才算已經(jīng)夠客觀?除了只檢驗“Taylor詩”外,Efron和Thisted還拿了幾位與莎士比亞同時代的詩人來比較,這樣做就更保險了。免得萬一莎士比亞那個時期的詩人,有如時尚般,生僻字之使用習慣類似,則此檢定就沒有什么參考價值了。
統(tǒng)計正如我們的思維,客觀至上,否則便是自欺欺人。反之我們的思維若是統(tǒng)計式的,便是極客觀的。
英國劍橋大學教授蘇斯倫德(William J. Sutherland)等2013年在《自然》雜志上發(fā)表了一篇名為“解讀科學觀點時應該知道的20個事實”的文章,閱后發(fā)現(xiàn)其中提到的科學事實都與統(tǒng)計思維有關。
現(xiàn)代科學研究中統(tǒng)計學是最重要的工具之一,英國著名生物學家高爾頓曾說過:“統(tǒng)計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學可以幫助他們打開一條通道?!边\用科學研究結論輔助現(xiàn)實決策時,須具備良好的統(tǒng)計思維,才能對科學結論保持清晰認識,更準確地解讀結論背后的科學真相。
大數(shù)據(jù)時代從信息不足轉變?yōu)樾畔⒎簽E,信息匱乏的危機讓位給信息甄別的困難,如此背景下科學方法成為每個人的必修課。在日益依賴數(shù)據(jù)的今天,樹立正確的統(tǒng)計思維,才能有效地開展數(shù)據(jù)處理與分析。當今世界正步入信息爆炸的大數(shù)據(jù)時代,統(tǒng)計越顯重要,驗證了英國科幻小說作家H·G·威爾斯的預言:“統(tǒng)計思維總有一天會像讀寫一樣,成為一個有效率公民的必備能力?!?
統(tǒng)計學被廣泛應用于各門學科之中,從自然科學到人文社會科學,甚至是工商業(yè)及政府的情報決策。作為認識自然、社會的工具和手段,統(tǒng)計研究客觀現(xiàn)象的數(shù)量關系,幫助政策制定者理解科研證據(jù)對決策的作用。正如現(xiàn)代統(tǒng)計學的奠基人費歇爾所講:“給20世紀帶來了人類進步的獨特方面是統(tǒng)計學,統(tǒng)計學的普遍存在以及在開拓新知識領域方面的應用已遠遠超過20世紀內的任何技術或科學發(fā)明?!?
馬寅初曾說:“學者不能離開統(tǒng)計而究學,實業(yè)家不能離開統(tǒng)計而執(zhí)業(yè),政治家不能離開統(tǒng)計而施政?!苯y(tǒng)計思維是在獲取數(shù)據(jù)、從數(shù)據(jù)中提取信息、論證結論可靠性等過程中表現(xiàn)出來的一種思維模式,對于人類提高認知起到巨大的作用。無論是解開自然奧秘的科學調查,或是考查早期匿名文學作品的作者、給出考古文物的時間年表,或是解決法庭爭端以及做出最佳決策等,統(tǒng)計思維都起到不可替代的重要作用。
統(tǒng)計學是一種由經(jīng)驗到理性的認識,是一種運用偶然發(fā)現(xiàn)規(guī)律的科學。它不只是一種方法或技術,還含有世界觀的成分——看待世界上萬千事物的一種方法,人們常講某事從統(tǒng)計角度看如何,指的就是這個意思。統(tǒng)計思維的養(yǎng)成不但需要學習一些具體的指示,還要能夠從發(fā)展的眼光,把這些指示連綴成一個有機的、清晰的圖景,獲得一種歷史的厚重感。正如德國的斯勒茲曾講道“統(tǒng)計是動態(tài)的歷史,歷史是靜態(tài)的統(tǒng)計?!?
從統(tǒng)計學的角度看,人們從經(jīng)驗或實驗中所獲取的知識是含有不確定性的,統(tǒng)計關注的是這種知識當中所含不確定性的度量問題,一旦能得到不確定性的量度,人們的知識就得到擴充,對世界的認知就朝前跨越,這個過程在人類知識積累的進程中不斷重復。難怪有人總結道:
在終極的分析中,一切知識都是歷史:我們現(xiàn)在擁有的知識都是對過去發(fā)現(xiàn)的事物的歸納總結以及衍生;
在抽象的意義下,一切科學都是數(shù)學:所有的知識都可以歸納為對數(shù)學的推理和運算;
在理性的基礎上,所有的判斷都源于統(tǒng)計學:所有的判斷都是對過去的規(guī)律總結,也就是說,根據(jù)過往的數(shù)據(jù)簡歷概率模型,判斷未來的趨勢。
2、什么是統(tǒng)計思維及其常見方式
首先我們來看看,統(tǒng)計學究竟在做些什么?
從隨機性中尋找規(guī)律性,是統(tǒng)計的基本思想,也是統(tǒng)計的魅力所在。
簡單來說,統(tǒng)計學里所表達的兩個核心理念就是:
允許誤差下的概率保證;
允許誤差下的統(tǒng)計推斷。
我們在中學里面所學到的知識探討的多半是必然性的問題。當它說1就是1,不會有任何誤差。而一個命題一旦被證明是對的,問題就會一直對下去,不會有例外,除非你能找出證明的漏洞。而在統(tǒng)計學里面,則是處處存在隨機性問題。它允許有誤差,沒有誤差反令人懷疑其中有假。統(tǒng)計也會對一個問題拍胸脯保證,但它的保證都是基于概率形式的。而且所能保證的概率,不但不是百分之百,而且還附有誤差。統(tǒng)計里則處處是“說不準”。例如,宣稱某飲料的容量有百分之九十五的概率介于425毫升至431毫升之間,就是一典型的統(tǒng)計上的保證。統(tǒng)計代表了一種我們看待這個世界的方式。
在隨機的世界中,真相往往難以大白,一切都是假設,就看你愿意接受哪一個。而接受的含義,就如同在婚禮上,當新娘點頭說“我愿意”,并不表示這位新郎就真正是最適合她的。只不過是“目前她愿意接受”。同樣地,在統(tǒng)計里接受不表示為真,拒絕也不表示為偽。統(tǒng)計學家的判定,都會給出誤差,是一種允許誤差下的統(tǒng)計推斷。
概率和誤差,構成了統(tǒng)計思維的兩大支柱。并發(fā)展出統(tǒng)計學里幾乎所著的關鍵要點。
統(tǒng)計學里的方法,和人們的思維方式有一定的對應關系。下面我們就來列舉下統(tǒng)計學中常見的思維方式。
(1)要有善于利用數(shù)據(jù)的思維
“ Data! Data!Data! ” he cried impatiently. “ I can’t make bricks without clay. ” 這是著名小說中福爾摩斯(Sherlock Holmes)說過的一句話。
沒有規(guī)矩不成方圓,沒有黏土不成磚墻,沒有數(shù)據(jù)則無法決策。
福爾摩斯可以依命案現(xiàn)場的一些蛛絲馬跡,推測兇嫌可能慣用左手,或可能經(jīng)過一片果園。算命看相者,所仰賴的也是資料。收集很多不同的面相及八字等的命運,當“閱人多矣”后,自然容易依據(jù)人的面相等,分析其前程。那些善于看透人性者,不也是閱人多矣嗎?做決策要有數(shù)據(jù),每一項數(shù)據(jù),都可能是有用的信息。統(tǒng)計學家的本事要能發(fā)揮,就得善用信息。因此對于統(tǒng)計學家,數(shù)據(jù)有如老鼠所愛之大米。
(2)要有善于捕捉不確定性的思維
宇宙的運轉,有必然性與隨機性交錯著進行。例如,我們知道哈雷慧星每76年接近地球一次(這是必然性)。雖然我們能知道76年后的事,但明天會不會下雨?就不是那么確定了(隨機性)。又如,將手上的硬幣松開,在中學物理課程里學過,如果忽略空氣阻力,則在高度固定下,硬幣落地所需時間,是個定值。但落地后那一面朝上?就無法預知了。這就是不確定性。
人們對未來,知道大致會發(fā)生哪些事,以及何發(fā)生,但又不能完全掌握。在隨機世界里,必然性使人們愿意事先好好準備,而不確定性則使人們對未來,充滿著盼望或者恐懼。光有必然性的世界,亳無變化,則對未來缺乏盼望,會讓人們喪失努力的動力。而光有隨機性的世界,只靠運氣,將讓人失去積極認真向上的決心。三分天注定,五分靠打拼,兩分靠運氣。這是造物者偉大的設計。
由于不確定性的存在,我們所能做的,就是要了解它,很多時候還要設法減少這些不確定性。因此,我們的先輩針對隨機的世界,總結了一些所謂的法則來應對這樣的不確定性。例如,大數(shù)法則(law of large numbers),另一個重要的隨機法則就是中心極限定理(central limit theorem)。
在統(tǒng)計里做預測和估計,本質上是在做以偏概全的事。雖偏卻能概全,這是統(tǒng)計學家的本領。
(3)要有相信概率的思維
數(shù)學家拉普拉斯(Pierre-Simon Laplace)曾說過“大部分生活中最重要的疑問, 都只是概率的問題”。在隨機世界里, 概率一詞大家瑯瑯上口, 但真正理解概率含義的人卻不多。
概率的意義究竟是什么呢?在諸如投擲骰子, 或抽簽時, 我們通常以“相同的可能性”來解釋概率。即骰子的6個面, 每個面出現(xiàn)機率皆認為是6分之1。該解釋在日常生活中還是比較適用的。當沒有其他信息時,常假設每一可能的結果發(fā)生之機率都一樣。
第二種方式,是以相對頻率來解釋概率。例如,如果一位職業(yè)籃球選手,過去的投籃命中率是0.527,表示該選手在接下來投籃的時候,命中率大抵就是0.527。這種常見的對概率的解釋也算比較客觀的。其背后之理論基礎就是大數(shù)法則。針對的現(xiàn)象, 則是可以重復觀測的。
最后一種方式是主觀概率。例如,世界杯足球賽巴西隊最后奪冠的概率,追上某一女孩的概率等等就是主觀概率,這些事件無法重復觀測,是一次性的。
上述三種對概率的解釋有時會交錯使用,或彼此相驗證。
還有小概率事件。原先你以為不可能的事情,只要觀測次數(shù)夠多, 就一定會發(fā)生。有人稱此為law of truly large numbers。當小機率遇上大樣本,其發(fā)生就不會太令人驚訝了。在隨機的世界里,要相信概率,而不是要挑戰(zhàn)概率。
(4)要有合理估計的思維
從前有一個賣油條的小孩,他一向把賣得的錢都放在盛油條的籃子里。某日由于尿急,于是把籃子放在一塊大石頭上,然后去廁所了。過一會兒回來,晴天霹靂,籃子里的錢全都不見了。他哭著跑去告訴縣官。縣官聽了后, 叫人把石頭抬來審問。雖一再恫嚇, 石頭一句話也不說??h官氣了,叫人拿棍子來打石頭。只是即使打到棍子斷了,石頭仍不說話。一旁看熱鬧的人都笑了起來。縣官更生氣,罰圍觀者每人拿兩個銅錢,扔進一個盛滿水的盆子里。突然,縣官指著一個人說“偷錢的人就是你?!蹦侨舜蠛粼┩?,眾人也不解??h官解釋說:“那小孩是賣油條的,他的錢上都沾著油。別人的錢扔進水里都沒有油浮上來,只有這個人扔錢進水后,有油浮上來, 可見錢是這人偷的?!蹦侨烁┦渍J罪,眾人皆心服。
這種縣官判案式的智慧,與教室玻璃破了,老師先從平常最調皮的學生問起的原理類似:當從幾個可能性里做挑選時,優(yōu)先挑最可能的情況。會不會出現(xiàn)錯誤?當然也是會的。憑口袋里的錢有油,就認定他偷了賣油條小孩的錢?如果有人收到賣油條者找的錢,不也就沾著油嗎?
但是,這種人們在做選擇時常采用的方法卻又是有效的。從統(tǒng)計思維的角度看,就是著名的最大概似法(method of maximum likelihood),該方法就是依據(jù)發(fā)生概率最大者來確定估計值的。這個方法有很多好的性質,而且常常能得到不錯的估計量。
美國NBA 職業(yè)籃球賽,各球隊互有勝負,很難說那一球隊才是最強。在常規(guī)比賽里,每支球隊要賽82場,各區(qū)勝率最高的8隊可打季后賽。所謂勝率,就是贏的場次除以比賽場次。為了維持比賽之可看性,NBA有一套選秀機制,使各隊實力不會很懸殊。有時全季排名第一者,勝率還不到6成。以一個球季多場比賽后的勝率,決定誰是今年較強者,得以參加季后賽,是職業(yè)球賽經(jīng)常采的作法。再例如,估計某項手術的成功概率,估計生三胞胎的的概率等,也是常采用這種以相對頻率來估計的想法。
隨著統(tǒng)計學的發(fā)展,種估計方法百各家爭鳴。這些有道理的估計方法,往往有各自的優(yōu)點,并且適用于某些場合,不會有哪種方法永遠是最佳的。例如,有時我們覺得給個范圍能更清楚的描述,這就是著名的置信區(qū)間(Confidence interval)估計方法。
(5)要有疑罪從無的假設檢驗思維
人們常求公平或公正。以簡單的兩人分蛋糕為例,,若雙方皆不愿拿得比較小,那有什么好方法來分?你切我選應該是一個令兩人都不覺得吃虧的辦法。最好是連由誰切,都以抽簽的方式。以免選方感覺他所得大于一半,而切方感覺他所得只有一半。
而疑罪從無推定原則便類似你切我選,屬于能令檢察官與被告,皆感到較公正的一種判決法。
1933年,波蘭人Neyman及英國人Pearson給出著名的Neyman-Pearson引理,奠定了統(tǒng)計學里的無罪推定原則,這就是假設檢驗(Hypothesis testing)。
英文中的假設hypothesis,是由古希臘文hypotithenai 演變而來, 科學上的假說(或稱假設學說)也是這個字。在數(shù)學里, 我們常在證明一命題是真或偽。但在隨機世界中,很多現(xiàn)象都只能視為假設,就看更愿意接受哪一個。接受不表示就完全相信該假設為真,拒絕也不表該假設為偽。統(tǒng)計里的假設,經(jīng)檢定后,不論接受那一個假設,都無法讓該假設成為定律,假設永遠是假設。
3、結束語
陳希孺先生在其《數(shù)理統(tǒng)計學簡史》的序中說道:“統(tǒng)計學不止是一種方法或技術,還含有世界觀的成分——它是看待世界上萬事萬物的一種方法。我們常講某事從統(tǒng)計觀點看如何如何,指的就是這個意思。但統(tǒng)計思想也有一個發(fā)展過程。因此統(tǒng)計思想(或觀點)的養(yǎng)成,不單需要學習一些具體的知識,還有能夠從發(fā)展的眼光,把這些知識連綴成一個有機的、清晰的途徑,獲得一種歷史的厚重感。”
建立起統(tǒng)計思維不是一朝一夕之功,要說有什么訣竅,那就是學習、實踐,再學習、再實踐,持續(xù)學習、持續(xù)實踐。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03