99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀R語言描述統(tǒng)計第一彈 | 計算泰坦尼克號不同艙位的存活率

R語言描述統(tǒng)計第一彈 | 計算泰坦尼克號不同艙位的存活率

2020-09-28

作者：丁點helper

來源：丁點幫你

今天開始學(xué)習(xí)在R語言中做描述性統(tǒng)計。為了便于大家邊學(xué)邊練，可以下載這個數(shù)據(jù)：

文件名：titanic.csv

鏈接：https://pan.baidu.com/s/1Pj0EsaBZdnw6mHPpeVd9Aw

密碼: yuym

將本地文件導(dǎo)入到R中

為了便于數(shù)據(jù)管理和操作，我們通常會把數(shù)據(jù)保存為.csv格式，這是excel中的一種較為簡單的數(shù)據(jù)格式。想要把一個.csv格式的數(shù)據(jù)導(dǎo)入R，可以用read.csv()這個函數(shù)：

# 將本地文件titanic.csv導(dǎo)入到R中，
# 并存儲到titanic這個對象中titanic 
  <- read.csv("http://Users//Desktop//titanic.csv"，header = TRUE)

假設(shè)該本地文件存儲的是1912年沉沒于大西洋的巨型郵輪泰坦尼克號中乘客的基本信息。

上面第一個命令"http://Users//Desktop//titanic.csv"是文件titanic.csv的本地存儲地址，大家要根據(jù)自己電腦的存儲位置自行調(diào)整；

第二個命令header = TRUE 是指將原文件中的第一行自動設(shè)置為文件的列名。

如果你的.csv文件中并無列名，而是希望在導(dǎo)入R之后再設(shè)置，則應(yīng)將第二個命令設(shè)置為header = FALSE。

了解數(shù)據(jù)

上篇文章講過，拿到一個數(shù)據(jù)庫，首先要了解它的基本信息。之前已經(jīng)講過，我們簡單復(fù)習(xí)一下。

class(titanic)  
#對象是什么數(shù)據(jù)結(jié)構(gòu)[1] "data.frame"dim(titanic)    
#查看數(shù)據(jù)有幾行幾列[1] 1309    6names(titanic)  
#查看數(shù)據(jù)的列名[1] "pclass"  "survived"  "sex"   "age"  "sibsp"  "parch" head(titanic)   
#查看前6行tail(titanic)   
#查看后6行

可以知道，titanic這個數(shù)據(jù)框中有1309條記錄，6個變量。

這6個變量依次為艙位等級、是否幸存、性別、年齡、同行的兄弟姐妹或配偶數(shù)量、同行的父母或子女?dāng)?shù)量。

描述性統(tǒng)計

接下來我們來對titanic這個數(shù)據(jù)做描述性統(tǒng)計。

1. 每個等級的船艙中分別有多少人？

有兩種方法，一是table()函數(shù)，用于統(tǒng)計分類變量pclass中各類別的頻數(shù)；二是summary()函數(shù)，功能是做描述性統(tǒng)計，既適用于分類也適用于計數(shù)變量，可以用來統(tǒng)計分類變量的頻數(shù)、計算計數(shù)變量的均數(shù)、百分位數(shù)等。

# 方法一table(titanic$pclass) 1st 2nd 3rd  323 277 709# 方法二summary(titanic$pclass) 1st 2nd 3rd  323 277 709

2. 遇難者與幸存者分別有多少人？

table(titanic$survived)   
died  survived       
809      500

3. 每個等級的艙位中分別有多少人遇難、多少人幸存？

本例中，按照『艙位等級』和『是否幸存』兩個條件統(tǒng)計乘客狀況，共6種可能。仍使用table()函數(shù)，統(tǒng)計每種可能的狀況分別有多少人，生成交叉列聯(lián)表。

# 將列聯(lián)表存儲在tab1中tab1 
  <- table(titanic$survived,titanic$pclass)
# 查看tab1的內(nèi)容tab1           
1st 2nd 3rd   died      
123 158 528   
survived  
200 119 181

4. 每個等級的艙位中幸存者的比例是多少呢？

思路很簡單，就是每等級艙位中幸存者的人數(shù)占該艙位總?cè)藬?shù)的比例。

1）那我們先看看每等級艙位中幸存者的人數(shù)怎么算，上面的tab1第二行就是，只需要將其提取出來，方法和前面講過的如何提取數(shù)據(jù)框中的行和列相同：

#提取tab1的第二行tab1[2, ] 
1st 2nd 3rd  
200 119 181

2）每種艙位總?cè)藬?shù)？上面也已經(jīng)計算過：

table(titanic$pclass) 
1st 2nd 3rd  
323 277 709

還有一種方法，使用apply()函數(shù)，功能是對矩陣類數(shù)據(jù)的行或列進行批量處理：

apply(tab1,2,sum) 
1st 2nd 3rd 
323 277 709

函數(shù)中有三個命令。第一個命令tab1表示待處理的數(shù)據(jù)；第二個命令2表示對tab1的每一列進行處理，若需處理每一行，則第二個命令應(yīng)輸入數(shù)字1；第三個命令sum表示求和。

因此，上述語句的意義為：對tab1中的每一列求和，即計算每個等級艙位中的總?cè)藬?shù)。

3）求每等級艙位中幸存者的人數(shù)占該艙位總?cè)藬?shù)的比例：

# 方法一
tab1[2, ]/table(titanic$pclass)      
1st       2nd       3rd    
0.6191950 0.4296029 0.2552891 
# 方法二
tab1[2, ]/apply(tab1,2,sum)      
1st       2nd       3rd    
0.6191950 0.4296029 0.2552891

4）你一定也發(fā)現(xiàn)了，這個結(jié)果非常不美觀，也不適合在科研工作中報告。我們做以下變化：

# 先乘以100
tab1[2, ]/apply(tab1,2,sum)*100 
1st      2nd      3rd 
61.91950 42.96029 25.52891
# 保留2位小數(shù) 
round(tab1[2, ]/apply(tab1,2,sum)*100,2)   
1st   2nd   3rd  
61.92 42.96 25.53

round()函數(shù)的功能是保留小數(shù)位數(shù)。

上面的代碼中，第一個命令tab1[2, ]/apply(tab1,2,sum)*100 是需要保留小數(shù)的對象；

第二個命令2是指保留2位小數(shù)。

5）可是這個結(jié)果顯然不對，加上百分號%才是準確的。需要用到paste()函數(shù)，該函數(shù)的功能是把各種元素連接起來，本例中，我們希望把數(shù)字和百分號連接：

paste(round(tab1[2, ]/apply(tab1,2,sum)*100,2),"%",sep="")
"61.92%" "42.96%" "25.53%"

第一個命令round(tab1[2, ]/apply(tab1,2,sum)*100,2) 就是上面計算好的百分數(shù)的數(shù)字部分，這是要連接的第一部分；

第二個命令"%" 是要連接的第二部分；

第三個命令sep="" 指兩個元素之間的連接符號，這里我們不需要任何連接符號，所以引號""之間什么都不用寫。

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

數(shù)據(jù)格式數(shù)據(jù)結(jié)構(gòu) R語言

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇豆瓣9.2！17萬條彈幕告訴你《沉默的真相》憑什么高口碑！

下一篇中級數(shù)據(jù)分析師，該有什么樣的能力？

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

R語言描述統(tǒng)計第一彈 | 計算泰坦尼克號不同艙位的存活率

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載