“大數(shù)定律”在大數(shù)據(jù)分析中的應(yīng)用
大數(shù)定律(law of large numbers),是一種描述當(dāng)試驗(yàn)次數(shù)很大時(shí)所呈現(xiàn)的概率性質(zhì)的定律。
在如今交易逐漸高頻化的時(shí)代,基于互聯(lián)網(wǎng)平臺的交易活動會產(chǎn)生大量的有效數(shù)據(jù)信息,具相關(guān)學(xué)者統(tǒng)計(jì),針對一個單一品種的商品,平均每1秒鐘會產(chǎn)生12個數(shù)據(jù),如此1個小時(shí)就可以產(chǎn)生43200個有效數(shù)據(jù)信息(3600×12=43200),面對如此高頻及海量的數(shù)據(jù)信息,如果沒有統(tǒng)計(jì)學(xué)思想的指導(dǎo),而只是單一的采用采用大數(shù)據(jù)分析的方法,將可能會使得數(shù)據(jù)挖掘效果相對滯后。
因此,我們完全可以將“大數(shù)定律”中的相關(guān)理論和方法運(yùn)用于大數(shù)據(jù)分析的實(shí)踐當(dāng)中,具體而言,“大數(shù)定律”在大數(shù)據(jù)分析當(dāng)中可以有如下幾個方面的運(yùn)用:
(1)將“大數(shù)定律”中“收斂值”的思想運(yùn)用于大數(shù)據(jù)分析中,可以使得數(shù)據(jù)分析人員明確其分析目標(biāo),進(jìn)而在遇到干擾時(shí),可以有效排除一些冗余的特殊值,繼而使其在更短的時(shí)間內(nèi)得出隱藏在數(shù)據(jù)信息背后的規(guī)律,一方面,可以提高工作效率,另一方面,也可以有效節(jié)省資源,避免不必要的資源浪費(fèi)。
(2)對于大數(shù)據(jù)分析得到結(jié)果時(shí)候,在后續(xù)的預(yù)測模型的構(gòu)建過程中,也可以參考“大數(shù)定律”的相關(guān)數(shù)學(xué)思想,從而實(shí)現(xiàn)對事物未來發(fā)展?fàn)顩r的預(yù)測。
(3)在大數(shù)據(jù)分析過程中,其算法的設(shè)計(jì)也可以有效借鑒“大數(shù)定律”的相關(guān)思想。








暫無數(shù)據(jù)