
數(shù)據(jù)分析中的變量分類
數(shù)據(jù)分析工作每天要面對各種各樣的數(shù)據(jù),每種數(shù)據(jù)都有其特定的含義、使用范圍和分析方法,同一個數(shù)據(jù)在不同環(huán)境下的意義也不一樣,因此我們想要選擇正確的分析方法,得出正確的結(jié)論,首先要明確分析目的,并準(zhǔn)確理解當(dāng)前的數(shù)據(jù)類型及含義。統(tǒng)計(jì)學(xué)中的變量指的是研究對象的特征,我們有時也稱為屬性,例如身高、性別等。每個變量都有變量值,變量值就是我們分析的內(nèi)容,它是沒有含義的,只是一個參與計(jì)算的數(shù)字,所以我們主要關(guān)注變量的類型,不同的變量類型有不同的分析方法。
變量主要是用來描述事物特征,那么按照描述的粗劣,有以下兩種劃分方法:
【定性變量】:也稱為名稱變量、品質(zhì)變量、分類變量,總之就是描述事物特性的變量,目的是將事物區(qū)分成互不相容的不同組別,變量值多為文字或符號,在分析時,需要轉(zhuǎn)化為特定含義的數(shù)字。
定性變量可以再細(xì)分為:
有序分類變量:描述事物等級或順序,變量值可以是數(shù)值型或字符型,可以進(jìn)而比較優(yōu)劣,如喜歡的程度:很喜歡、一般、不喜歡
無序分類變量:取值之間沒有順序差別,僅做分類,又可分為二分類變量和多分類變量 二分類變量是指將全部數(shù)據(jù)分成兩個類別,如男、女,對、錯,陰、陽等,二分類變量是一種特殊的分類變量,有其特有的分析方法。 多分類變量是指兩個以上類別,如血型分為A、B、AB、O
【定量變量】:也稱為數(shù)值型變量,是描述事物數(shù)字信息的變量,變量值就是數(shù)字,如長度、重量、產(chǎn)量、人口、速度和溫度。
連續(xù)型變量:在一定區(qū)間內(nèi)可以任意取值,其數(shù)值是連續(xù)不斷的,相鄰兩個數(shù)值可作無限分割,即可取無限個數(shù)值。如身高、繩子的長度等。
離散型變量:值只能用自然數(shù)或整數(shù)單位計(jì)算,其數(shù)值是間斷的,相鄰兩個數(shù)值之間不再有其他數(shù)值,這種變量的取值一般使用計(jì)數(shù)方法取得。
【定類變量】
測量事物類別或?qū)傩?,各類支架沒有順序或等級,實(shí)際上也就是上面說的無序分類變量,所包含的數(shù)據(jù)信息很少,只能計(jì)算頻數(shù)和頻率,是最低層次的一種變量
【定序變量】
測量事物之間的等級或順序,就是上述的有序分類變量,由于它的變量值可以是數(shù)值型或字符型,并且可以反映等級之間的優(yōu)劣,除了可以計(jì)算頻數(shù)和頻率之外,還可以計(jì)算累計(jì)頻率,因此數(shù)據(jù)包含的信息多于定類變量。
【定距變量】
測量事物的類別或順序之間的間距,它不但具有定類和定序變量的特點(diǎn),還能計(jì)算類別之間的差距,可以進(jìn)行加減運(yùn)算,數(shù)據(jù)包含的信息高于前兩種
【定比變量】 測量事物類別比值,和定距變量相比,它不但可以進(jìn)行加減運(yùn)算,還可以進(jìn)行乘除運(yùn)算,包含的數(shù)據(jù)信息最多,是最高級的變量。
上面這四種變量可以從淺到深精確的描述事物,四種變量級別從低到高,高層次變量可以向低層次轉(zhuǎn)化,代價(jià)是損失部分?jǐn)?shù)據(jù)信息,但是低層次變量無法向高層次轉(zhuǎn)化,這會得出錯誤結(jié)果。
前面兩種分類方法都是從變量對事物的描述角度出發(fā)進(jìn)行分類,一旦對事物描述確定下來,那么變量的取值也就相應(yīng)確定下來了,比如定性變量的取值只能是某屬性下的計(jì)數(shù),比如人數(shù)、客戶數(shù)等,因此只能取特定的值,數(shù)值是離散的。而定量變量可以取某屬性下的任意值,變量值即可連續(xù)也可離散,比如身高、體重、銷售額等。連續(xù)型數(shù)值和離散型數(shù)值的分析方法是不同的,因此從統(tǒng)計(jì)學(xué)角度,又經(jīng)常劃分為連續(xù)型變量和定性變量(分類變量)
關(guān)于變量的類型及取值方法,可以歸納為下表
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03