
SPSS統(tǒng)計基礎(chǔ)---頻率的使用
頻率過程提供有助于描述多種類型的變量的統(tǒng)計量和圖形顯示。頻率過程是查看數(shù)據(jù)理想的開始位置。對于頻率報告和條形圖,可以用升序或降序排列不同的值,也可以按其頻率對類別進(jìn)行排序。當(dāng)變量具有許多不相同的值時,可提取頻率報告。您可以使用頻率(缺省值)或百分比標(biāo)記圖表。
示例。按行業(yè)類型劃分的公司客戶的分布是什么?從輸出中可以了解到客戶的37.5%來自政府機構(gòu),24.9% 來自公司,28.1% 來自學(xué)術(shù)機構(gòu),9.4% 來自保健行業(yè)。對于連續(xù)的定量數(shù)據(jù)(例如,銷售收入),您會了解到平均產(chǎn)品銷售額為3,576 美元,標(biāo)準(zhǔn)差為1,078 美元。
統(tǒng)計量和圖。頻率計數(shù)、百分比、累計百分比、均值、中位數(shù)、眾數(shù)、和、標(biāo)準(zhǔn)差、方差、范圍、最小值和最大值、均值標(biāo)準(zhǔn)誤、偏度和峰度(兩者都帶有標(biāo)準(zhǔn)誤)、四分位數(shù)、用戶指定的百分位數(shù)、條形圖、餅圖和直方圖。
數(shù)據(jù)。使用數(shù)值代碼或字符串以對分類變量進(jìn)行編碼(名義或序數(shù)級別度量)。
假設(shè)。特別對于已排序或未排序的類別的變量,表格和百分比可以提供對所有分布中的數(shù)據(jù)都有用的描述。大多數(shù)可選摘要統(tǒng)計量(如均值和標(biāo)準(zhǔn)差)是基于正態(tài)理論的,它們適用于對稱分布的定量變量。穩(wěn)健統(tǒng)計量(如中位數(shù)、四分位數(shù)和百分位數(shù))適合于可能符合或可能不符合正態(tài)假設(shè)的定量變量。
獲取頻率表
E 從菜單中選擇:
分析> 描述統(tǒng)計> 頻率...
選擇一個或多個分類變量或定量變量。
根據(jù)需要,您可以:
單擊統(tǒng)計量以獲得定量變量的描述統(tǒng)計。
單擊結(jié)果顯示順序的格式。
頻率統(tǒng)計量
百分位值。一個定量變量的值,其將排序過的數(shù)據(jù)分組,以使某個百分比在上而另外一個百分比在下。四分位數(shù)(第25、50、75 個百分位數(shù))將觀察值分為四個大小相等的組。如果您想讓組數(shù)不等于4,請選擇n 個相等組的割點。您也可指定單個百分位數(shù)(例如,第95 個百分點,有95% 的觀察值大于該值)。
集中趨勢。描述分布位置的統(tǒng)計量,包括均值、中位數(shù)、眾數(shù)和所有值的總和。
均值. 集中趨勢的測量。算術(shù)平均,總和除以個案個數(shù)。
中位數(shù). 第50 個百分位,大于該值和小于該值的個案數(shù)各占一半。如果個案個
數(shù)為偶數(shù),則中位數(shù)是個案在以升序或降序排列的情況下最中間的兩個個案的平均。中位數(shù)是集中趨勢的測量,但對于遠(yuǎn)離中心的值不敏感(這與均值不同,均值容易受到少數(shù)多個非常大或非常小的值的影響)。
眾數(shù). 最頻繁出現(xiàn)的值。如果出現(xiàn)頻率最高的值不止一個,則每一個都是一個眾
數(shù)?!邦l率”過程僅報告此類多個眾數(shù)中最小的那個。
總和. 所有帶有非缺失值的個案的值的合計或總計。
離散程度。測量數(shù)據(jù)中變異和展開的統(tǒng)計量,包括標(biāo)準(zhǔn)差、方差、范圍、最小值、最大值和均值標(biāo)準(zhǔn)誤。
標(biāo)準(zhǔn)差. 對圍繞均值的離差的測量。在正態(tài)分布中,68% 的個案在均值的一倍標(biāo)準(zhǔn)差范圍內(nèi),95% 的個案在均值的兩倍標(biāo)準(zhǔn)差范圍內(nèi)。例如,在正態(tài)分布中,如果平均年齡為45,標(biāo)準(zhǔn)差為10,則95% 的個案將處于25 到65 之間。
方差. 對圍繞均值的離差的測量,值等于與均值的差的平方和除以個案數(shù)減一。度量方差的單位是變量本身的單位的平方。
全距. 數(shù)值變量最大值和最小值之間的差;最大值減去最小值。
最小值. 數(shù)值變量的最小值。
最大值. 數(shù)值變量的最大值。
均值的標(biāo)準(zhǔn)誤. 取自同一分布的樣本與樣本之間的均值之差的測量。它可以用來粗略地將觀察到的均值與假設(shè)值進(jìn)行比較(即,如果差與標(biāo)準(zhǔn)誤的比值小于-2 或大于+2,則可以斷定兩個值不同)。
分布。偏度和峰度是描述分布形狀和對稱性的統(tǒng)計量。這些統(tǒng)計量與其標(biāo)準(zhǔn)誤一起顯示。
偏度. 分布的不對稱性度量。正態(tài)分布是對稱的,偏度值為0。具有顯著正偏度值的分布有很長的右尾。具有顯著的負(fù)偏度的分布有很長的左尾。作為一個指導(dǎo),當(dāng)偏度值超過標(biāo)準(zhǔn)誤的兩倍時,則認(rèn)為不具有對稱性。
峰度. 觀察值聚集在中點周圍的程度的測量。對于正態(tài)分布,峰度統(tǒng)計量的值為
0。正峰度值表示相對于正態(tài)分布,觀察值在分布中心的聚集更多,同時尾部更薄,直到分布極值。在這一點,leptokurtic 分布的尾部比正態(tài)分布的尾部要厚。負(fù)峰度值表示相對于正態(tài)分布,觀察值聚集得少并且尾部較厚,直到分布極值。在這一點,platykurtic 分布的尾部比正態(tài)分布的尾部要薄。
值是組中點。如果您的數(shù)據(jù)中的值是組中點(例如,所有年齡在30 多歲的人都被編碼為35),則選擇此選項以估計原始未分組的數(shù)據(jù)的中位數(shù)和百分位數(shù)。
頻率圖
圖表類型。餅圖顯示各部分對整體的貢獻(xiàn)。餅圖的每個分區(qū)對應(yīng)于由單個分組變量定義的組。條形圖將不同值或不同類別的計數(shù)作為單獨的條顯示,使您可以直觀地比較各個類別。直方圖也有條,但它們沿著相等的區(qū)間刻度進(jìn)行繪制。每個條的高度是定量變量在該區(qū)間內(nèi)的值的計數(shù)。直方圖顯示分布的形狀、中心和分布。疊加在直方圖上的正態(tài)曲線有助于您判斷數(shù)據(jù)是否為正態(tài)分布。
圖表值。對于條形圖,可以按頻率計數(shù)或百分比標(biāo)記刻度軸。
頻率格式
排序方式??筛鶕?jù)數(shù)據(jù)中的實際值或根據(jù)這些值的計數(shù)(出現(xiàn)的頻率)以升序或降序排列頻率表。但是,如果您請求直方圖或百分位數(shù),則頻率假定變量是定量數(shù)據(jù)并以升序顯示其值。
多個變量。如果您生成多個變量的統(tǒng)計表,您可在單個表中顯示所有變量(比較變量),或顯示每個變量的獨立統(tǒng)計量表(按變量組織輸出)。排除超過n 個類別的表。此選項防止顯示具有超過指定數(shù)目的值的表。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實踐的落地者與價值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價值,最終要在 “實踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10