統(tǒng)計(jì)學(xué):一門收集、處理、分析、解釋數(shù)據(jù)并從中得出結(jié)論的科學(xué)。
【步驟】
收集數(shù)據(jù)→處理數(shù)據(jù)→分析數(shù)據(jù)→解釋數(shù)據(jù)
抓取 清洗 方法:兩大類
爬數(shù) (1)描述性分析方法
(2)推斷性分析方法①估計(jì)
②假設(shè)檢驗(yàn)
1、數(shù)據(jù)
(1)形式:
①數(shù)字:嚴(yán)格的數(shù)字上的符號
②文字:不可運(yùn)算
核心區(qū)別:是否可以運(yùn)算
(2)按計(jì)量尺度不同分類
①分類型
②順序型(分類型中的一份子)
③數(shù)值型
Tips:①與②是文字型,又叫定性數(shù)據(jù)/品質(zhì)數(shù)據(jù);③是數(shù)值型,又叫定量數(shù)據(jù),精確定位。
【結(jié)論】
①區(qū)間(分組的數(shù)值型數(shù)據(jù))屬于數(shù)值型;
②不同類型數(shù)據(jù)之間可以進(jìn)行轉(zhuǎn)換(高級→低級,反之不行);
③一個(gè)重要的規(guī)律:低級方法高級可以用,但高級方法低級不可用
☆方法:人提出來的。
(3)其他分類:
①按來源:直接來源和間接來源;
②按收集方式:觀測的數(shù)據(jù)和實(shí)驗(yàn)的數(shù)據(jù);
③按與時(shí)間的關(guān)系:截面數(shù)據(jù)、時(shí)間序列數(shù)據(jù)、混合數(shù)據(jù)(面板數(shù)據(jù));
④特殊:虛擬變量數(shù)據(jù)
2、總體和樣本
(1)總體:研究的所有元素的集合,每個(gè)元素成為個(gè)體;
(2)樣本:從總體中抽取的一部分元素的集合,構(gòu)成樣本的元素的數(shù)目成為樣本容量;
樣本推斷總體。
3、參數(shù)和統(tǒng)計(jì)量
(1)參數(shù):研究者想要了解的總體的某種特征值;
【e.g.】總體均值()、標(biāo)準(zhǔn)差()、總體比例(π)
(2)統(tǒng)計(jì)量:根據(jù)樣本數(shù)據(jù)計(jì)算出來的一個(gè)量,即樣本的某個(gè)特征值;
【e.g.】樣本均值()、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)
4、變量
定義:指描述事物某種特征的概念。
【e.g.】商品銷售額、受教育程度
變量的具體表現(xiàn)成為變量值,即數(shù)據(jù)。
分類:
①分類變量:說明事物類別的一個(gè)名稱;
②順序變量:說明事物有序類別的一個(gè)名稱;
③數(shù)值型變量:說明事物數(shù)字特征的一個(gè)名稱;








暫無數(shù)據(jù)