
統(tǒng)計學中的基本概念
1、描述統(tǒng)計與推斷統(tǒng)計
描述統(tǒng)計(Descriptive Statistics):用表格、圖形和數(shù)字來概括、顯示數(shù)據(jù)特征的統(tǒng)計方法。
例1:2005年我國出生人口性別比(男:女)已經(jīng)升高到119.92,與正常值106相比有嚴重的偏離。
例2:中國經(jīng)濟增長的起伏
推斷統(tǒng)計(Inferentia Statistics):從總體中抽取樣本,并利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。
總體(popuation):由統(tǒng)計研究所涉及的那些同質(zhì)個體(也稱單位)所形成的集合。
樣本(sampe):所研究總體的一部分。
例1: 2003年人口變動抽樣調(diào)查以全國為總體,在全國抽取了990個縣(市、區(qū))、3734個鄉(xiāng)(鎮(zhèn)、街道)、6544個調(diào)查小區(qū)的126萬人。根據(jù)調(diào)查結(jié)果推算,2003年末全國總?cè)丝跒?29227萬人,出生人口為1599萬人,死亡人口為825萬人,凈增人口為774萬人。
例2:一家大公司的會計部門會從所有的發(fā)票中選擇一部分來檢查公司所有發(fā)票的準確性。
2、數(shù)據(jù)和變量類型
(1)、定類尺度 (Nomina Scae)
也稱列名尺度、名義尺度、分類尺度
例如:性別、民族、職業(yè)
數(shù)據(jù)表現(xiàn)為“類別”
各類之間無等級次序
各類別可以用數(shù)字代碼表示
根據(jù)定類尺度得到的數(shù)據(jù)為分類數(shù)據(jù)。
(2)、定序尺度(Ordina Scae)
也稱順序尺度
例如健康狀況、質(zhì)量等級
數(shù)據(jù)表現(xiàn)為“類別”
可對等級、大小等排序
未測量出類別之間的準確差值
根據(jù)定序尺度得到的數(shù)據(jù)為順序數(shù)據(jù)。
(3)、定距尺度 Interva Scae
也稱間隔尺度
例如年份、攝氏溫度
數(shù)據(jù)表現(xiàn)為“數(shù)值”
可以進行加減運算
“0”是只是尺度上的一個點,不代表“不存在”
根據(jù)定距尺度得到的數(shù)據(jù)為間距數(shù)據(jù)。
(4)、定比尺度 Ratio Scae
也稱比率尺度
例如體重、身高
數(shù)據(jù)表現(xiàn)為“數(shù)值”
可以進行加減、乘除運算
“0”表示“沒有”或“不存在”
根據(jù)定比尺度得到的數(shù)據(jù)為比率數(shù)據(jù)。
定距尺度與定比尺度的區(qū)別
定距尺度中“0”表示一個具體數(shù)值,不表示“沒有”或“不存在”,定比尺度中“0”表示“沒有”或“不存在” 。
在實際應用中定距尺度與定比尺度差別微不足道,往往不作區(qū)分。 例如在SPSS Statistics軟件中,數(shù)據(jù)的計量尺度被分為3類:名義(Nomina)、有序(Ordina)、 度量(Scae )
四種計量尺度的比較
1、四種尺度所包含的信息量是依次遞增的,級別由低到高。
2、根據(jù)較高層次的計量尺度可以獲得較低層次的計量尺度。
3、不同的尺度數(shù)據(jù)對應這不同數(shù)據(jù)顯示方法和分析方法。
數(shù)據(jù)和變量類型:總結(jié)
變量的概念和類型
變量是用來描述現(xiàn)象某種令人感興趣的特征的概念。
品質(zhì)變量是描述個體有關(guān)屬性特征的變量,本質(zhì)上不能用數(shù)字來表示。例如性別。
數(shù)量變量是描述個體有關(guān)數(shù)量特征的變量,都是用數(shù)字來表示的。例如人數(shù),年齡等。
離散型變量指的是有限個數(shù)值或諸如0,1,2……之類無限可列值的變量。
如果某一變量可以取某一區(qū)間或多個區(qū)間中任意數(shù)值,則該變量稱為連續(xù)型變量。
橫截面、時間序列和面板數(shù)據(jù)
橫截面數(shù)據(jù)(Cross-sectiona data)是在同一時點或是大約在同一時點所收集的數(shù)據(jù)。
例如2016年我國各直轄市的GDP 。
時間序列數(shù)據(jù)(Time series data)是按時間順序取得的一系列數(shù)據(jù)。
例如我國歷年的GDP。
面板數(shù)據(jù)(Pane Data):對多個事物在不同時期或時點上進行測量得到的數(shù)據(jù) 。如1996-2016年全國各個省份的GDP
3、統(tǒng)計指標的概念
一般有兩種理解和兩種使用方法:
1、統(tǒng)計指標是指反映現(xiàn)象數(shù)量特征的概念。如年末人口數(shù)、商品銷售額、勞動生產(chǎn)率等。
2、統(tǒng)計指標是反映現(xiàn)象數(shù)量特征的概念和具體數(shù)值。如我國2016年的國內(nèi)生產(chǎn)總值 。
(1)總量指標
也稱為絕對數(shù):以絕對數(shù)形式表現(xiàn)現(xiàn)象規(guī)模和水平的統(tǒng)計指標??梢苑譃闀r點數(shù)和時期數(shù)。
例如,2007全年入境旅游人數(shù)13187萬人次 ;2007年全年國內(nèi)生產(chǎn)總值246619億元 ;2007年末全國參加城鎮(zhèn)基本養(yǎng)老保險人數(shù)為20107萬人 .
(2)時點數(shù)和時期數(shù)
時點數(shù):是描述某種現(xiàn)象在某一個特定時刻(某一瞬間或某一時點)數(shù)量表現(xiàn)的數(shù)據(jù)。
例如,2007年年末全國總?cè)丝跒?32129萬人 。
時期數(shù):是描述某種現(xiàn)象在某一個特定時間范圍內(nèi)所實現(xiàn)的成果的數(shù)據(jù)。例如,2004年我國全年各種運輸方式完成貨物運輸周轉(zhuǎn)量66698億噸公里。
區(qū)分數(shù)據(jù)是時點數(shù)還是時期數(shù)的方法之一看其加總后的結(jié)果是否有意義。若有意義則該指標必定是時期數(shù)。反之,則必定是時點數(shù)。
(3)相對數(shù)和平均數(shù)
相對指標:采用兩個有聯(lián)系的數(shù)值進行對比而得到的比值。也稱為相對數(shù),如產(chǎn)業(yè)結(jié)構(gòu)比例、性別比、人口密度等等。
平均指標:也稱為平均數(shù),反映現(xiàn)象在某一時間或空間上的平均數(shù)量水平。例如職工的平均工資,平均考試成績,等等。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10