
R語言學(xué)習(xí)之矩陣
很多人是在線性代數(shù)課學(xué)的矩陣,當(dāng)時什么問題都沒有,除了一個問題:學(xué)習(xí)矩陣到底有什么用呢?矩陣是一個集合,它里面可以存放很多對象,比如一個行就是一個對象(或者說記錄),每一個對象又有很多(屬性)列。如果把一組對象~屬性表示成矩陣,我們就能很容易取出每個對象對應(yīng)的某個屬性了,并且根據(jù)線性代數(shù)方法考察兩個對象之間的聯(lián)系(相似性)。矩陣的行列數(shù)我們一般稱作維數(shù)。
對于矩陣而言,我們當(dāng)然想實現(xiàn)以下操作與功能:
矩陣的加減、乘除運(yùn)算
矩陣的行列切片
最值的快速獲取
線性代數(shù)運(yùn)算
好在R語言中的矩陣可以很輕易幫我們實現(xiàn)這些功能,有了這一神兵利器,我們就可以游刃有余地操作應(yīng)該算是數(shù)據(jù)分析的基本單位——矩陣了。
創(chuàng)建矩陣
R中直接調(diào)用函數(shù)matrix()可以快速自定義矩陣,下面一行命令可以快速創(chuàng)建一個4行3列的矩陣:
>a<-matrix(c(1:12),nrow=4,ncol=3,byrow=TRUE)
> a
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
這里相當(dāng)于先創(chuàng)建一個向量,再將其轉(zhuǎn)化為一個4x3的矩陣,bynow=TRUE表示會按照把第一行排滿,接著排第二行。
還有一些其它小技巧,比如有時候我們需要初始化一個矩陣,以便于后面對其進(jìn)行賦值:
> a1<-matrix(0,3,4)
> a1
[,1] [,2] [,3] [,4]
[1,] 0 0 0 0
[2,] 0 0 0 0
[3,] 0 0 0 0
矩陣行、列、元素的選?。ㄇ衅?br />
取第一行第二列元素
> a[1,2]
[1] 2
取第一行元素,這與Matlab很相像
> a[1,]
[1] 1 2 3
取第一行除了第二個元素之外的元素
> a[1,-2]
[1] 1 3
取第一列元素
> a[,1]
[1] 1 4 7 10
取第一列除了第二個元素之外的元素
> a[-2,1]
[1] 1 7 10
矩陣全部元素
> a[,]
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
矩陣的基本運(yùn)算
這里創(chuàng)建一個新的矩陣b、c1,b與a的維數(shù)相同,c1的列、行數(shù)與a的行、列數(shù)分別相等,便于做實驗。
> b<-matrix(c(13:24),nrow=4,ncol=3,byrow = TRUE)
> b
[,1] [,2] [,3]
[1,] 13 14 15
[2,] 16 17 18
[3,] 19 20 21
[4,] 22 23 24
> c1<-matrix(c(13:24),nrow=3,ncol=4,byrow = TRUE)
> c1
[,1] [,2] [,3] [,4]
[1,] 13 14 15 16
[2,] 17 18 19 20
[3,] 21 22 23 24
獲取矩陣維數(shù)
> dim(a)
[1] 4 3
加減法運(yùn)算
矩陣的加減法運(yùn)算表示兩個矩陣對應(yīng)元素分別進(jìn)行加減法運(yùn)算,返回兩個矩陣對應(yīng)元素分別進(jìn)行加減法運(yùn)算的矩陣。當(dāng)然了,矩陣加減法運(yùn)算前提是兩個矩陣的維數(shù)必須一樣,否則會報錯。
> a+b
[,1] [,2] [,3]
[1,] 14 16 18
[2,] 20 22 24
[3,] 26 28 30
[4,] 32 34 36
乘除法運(yùn)算
矩陣的乘除法運(yùn)算表示兩個矩陣對應(yīng)元素分別進(jìn)行乘除法運(yùn)算,返回兩個矩陣對應(yīng)元素分別進(jìn)行乘除法運(yùn)算的矩陣。當(dāng)然了,矩陣乘除法運(yùn)算前提是兩個矩陣的維數(shù)必須一樣,否則會報錯。
> a*b
[,1] [,2] [,3]
[1,] 13 28 45
[2,] 64 85 108
[3,] 133 160 189
[4,] 220 253 288
還有就是矩陣的乘法,要求是前面矩陣的列數(shù)等于后面矩陣的列數(shù),返回一個左邊矩陣行數(shù)x右邊矩陣列數(shù)的矩陣。
> a%*%c1
[,1] [,2] [,3] [,4]
[1,] 110 116 122 128
[2,] 263 278 293 308
[3,] 416 440 464 488
[4,] 569 602 635 668
線性代數(shù)運(yùn)算
R語言提供了很多用于線性代數(shù)運(yùn)算的函數(shù),常用的列出如下:
eigen() #求特征值和特征向量
solve() #求逆矩陣
chol() #Choleski分解
svd() #奇異值分解
qr() #QR分解
det() #求行列式
dim() #給出行列數(shù)
t() #矩陣轉(zhuǎn)置
矩陣的拼接
R語言矩陣的拼接主要用到兩個函數(shù),rbind()、cbind()
按行拼接要求兩個矩陣列數(shù)要相同rbind()
> rbind(a,b)
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
[5,] 13 14 15
[6,] 16 17 18
[7,] 19 20 21
[8,] 22 23 24
按列拼接要求兩個矩陣行數(shù)要相同cbind()
> cbind(c1,matrix(c(1:6),nrow = 3,byrow = TRUE))
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 13 14 15 16 1 2
[2,] 17 18 19 20 3 4
[3,] 21 22 23 24 5 6
其它函數(shù)的靈活結(jié)合
矩陣相關(guān)計算求法還可以靈活應(yīng)用其它函數(shù),比如求和函數(shù)sum(),平均值函數(shù)mean(),最值函數(shù)max()等。
> a
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
[3,] 7 8 9
[4,] 10 11 12
> max(a)
[1] 12
第一行最大值
>max(a[1,])
[1] 3
> max(a[,1])
[1] 10
對第一行求和
> sum(a[1,])
[1] 6
> mean(a[,1])
[1] 5.5
還有就是結(jié)合apply()函數(shù),后面會講到。
用法,舉個例子。apply(Matrix,1,FUN=mean),這里,F(xiàn)UN=mean計算矩陣Matrix每一行的平均值,以向量的形式返回,中間的參數(shù)‘1’表示求每一行均值,如果是‘2’,表示求每一列均值
比如:
求a每一行平均值
> apply(a,1,mean)
[1] 2 5 8 11
對a每一列分別求和
> apply(a,2,sum)
[1] 22 26 30
好了,關(guān)于矩陣就講到這里,希望對你們有用。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10