
作者:丁點helper
來源:丁點幫你
回憶一下上一講用到的例子:
輸入數(shù)據(jù)的代碼在上一講詳細講解過,這里總結如下:
age <- c(25, 34, 59, 60, 20) #患者年齡type <- c(1, 2, 2, 2, 1) #糖尿病類型status <- c("poor", "improved", "excellent", "poor", "excellent") #病情comorbidity<- c(TRUE, FALSE, FALSE, TRUE, FALSE) #出現(xiàn)并發(fā)癥
age、type、status、comorbidity中分別僅有一種數(shù)據(jù)類型,它們都是向量。本文介紹生成向量之后,如何對其進行簡單的操作。
1. 查看與改變向量的數(shù)據(jù)類型
看到一個向量,首先要搞清楚其中包含的數(shù)據(jù)類型。就本例而言,從表面看也很容易區(qū)分,但實際上一項統(tǒng)計分析工作用到的向量可能很多,用函數(shù)class()可以快速知曉某向量的數(shù)據(jù)類型,例如:
class(age) [1] "numeric"class(type) [1] "numeric"class(status) [1] "character"class(comorbidity)[1] "logical"
不同類型的數(shù)據(jù)可以根據(jù)需要互相轉換,用as.目標數(shù)據(jù)類型()函數(shù):
as.numeric() #將括號中的內容轉變?yōu)閿?shù)值型數(shù)據(jù) as.character() #轉變?yōu)樽址蚢s.logical() #轉變?yōu)檫壿嬓蚢s.factor() #轉變?yōu)橐蜃有?/pre>所以也可用as.character()將type中的數(shù)值型數(shù)據(jù)轉變?yōu)樽址停?
type[1] 1 2 2 2 1class(type) [1] "numeric" type <- as.character(type) # 注意要將新的結果賦值給typetype[1] "1" "2" "2" "2" "1"class(type)[1] "character"之前講過,將定性變量(即分類變量)以因子的形式輸入會有助于后續(xù)的統(tǒng)計分析工作,factor()這個函數(shù)可以幫我們把數(shù)據(jù)轉變?yōu)橐蜃有停?
type <- c(1, 2, 2, 2, 1) type <- factor(type) type[1] 1 2 2 2 1 Levels: 1 2class(type)[1] "factor"用1和2這樣的阿拉伯數(shù)字其實不太利于準確地表達數(shù)據(jù)內容,可以給原來的1和2加上標簽:
type <- factor(type, levels = c("1", "2"), labels = c("Type 1", "Type 2")) type[1] Type 1 Type 2 Type 2 Type 2 Type 1 Levels: Type 1 Type 2所以在輸入定性變量(分類變量)時可以采用這種簡便方法。
再看另一個例子:
status[1] "poor" "improved" "excellent" "poor" "excellent" status <- factor(status)status[1] poor improved excellent poor excellentLevels: excellent improved poorclass(status)[1] "factor"由于status是一個有序分類變量,所以在轉變?yōu)橐蜃訒r還應體現(xiàn)其順序:
status <- factor(status, levels = c('poor', 'improved','excellent'),ordered = TRUE) status[1] poor improved excellent poor excellentLevels: poor < improved < excellent這里的順序是根據(jù)levels這個命令中的內容生成的,可自行調整levels命令中的順序:status <- factor(status, levels = c('excellent','improved' ,'poor'),ordered = TRUE) status[1] poor improved excellent poor excellentLevels: excellent < improved < poor2. 向量中的數(shù)據(jù)定位
以age這個向量為例:
age <- c(25, 34, 59, 60, 20) age [1] 25 34 59 60 20輸出向量中排在第3位的數(shù)據(jù):
age[3] [1] 59輸出排在1,2,5位的數(shù)據(jù):
age[c(1,2,5)] [1] 25 34 20輸出1至3位的數(shù)據(jù):
age[c(1:3)] [1] 25 34 593. 向量中的數(shù)據(jù)計算
以age這個向量為例:
age <- c(25, 34, 59, 60, 20) # 仍以age為例age [1] 25 34 59 60 20 age+4 # 給向量中每個數(shù)都加4 [1] 29 38 63 64 24 sqrt(age) # 求平方根 [1] 5.000000 5.830952 7.681146 7.745967 4.472136 sort(age) # 給數(shù)據(jù)從低到高排序 [1] 20 25 34 59 60 sort(age, decreasing =T) # 給數(shù)據(jù)從高到低排序 [1] 60 59 34 25 20 age2 <- c(20,30,40,50,60) # 再生成一個向量 age+age2 # 將兩向量中的元素相加 [1] 45 64 99 110 804. 生成特定形式的向量
生成重復數(shù)據(jù)。用rep(x, ……),x表示要重復的內容。
rep(1,times=5) #times表示重復的次數(shù) [1] 1 1 1 1 1 rep(c(1,2),4) #times這個表達可以省略 [1] 1 2 1 2 1 2 1 2 rep(c(1,2),each=4) #each也是針對重復次數(shù)的命令 [1] 1 1 1 1 2 2 2 2特定間隔的數(shù)據(jù)。用seq(from,to,by)這個函數(shù),from為起始值,to為終止值,by為數(shù)據(jù)之間的間隔。
seq(1,100,19) #from,to,by都可以省略 [1] 1 20 39 58 77 96 seq(1,10) #如果不指定by的內容,則默認為1 [1] 1 2 3 4 5 6 7 8 9 10下一篇介紹數(shù)據(jù)框的相關操作。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03