
機(jī)器學(xué)習(xí)中的線性代數(shù)
線性代數(shù)作為數(shù)學(xué)中的一個(gè)重要的分支,廣發(fā)應(yīng)用在科學(xué)與工程中。掌握好線性代數(shù)對(duì)于理解和從事機(jī)器學(xué)習(xí)算法相關(guān)的工作是很有必要的,尤其是對(duì)于深度學(xué)習(xí)而言。因此,在開(kāi)始介紹深度學(xué)習(xí)之前,先集中探討一些必備的線性代數(shù)知識(shí)。
2.1 標(biāo)量,向量,矩陣和張量
標(biāo)量(scalar):一個(gè)標(biāo)量就是一個(gè)單獨(dú)的數(shù)。用斜體表示標(biāo)量,如s∈R
.
向量(vector):一個(gè)向量是一列數(shù),我們用粗體的小寫(xiě)名稱(chēng)表示向量。比如x
,將向量x
寫(xiě)成方括號(hào)包含的縱柱:
矩陣(matrix):矩陣是二維數(shù)組,我們通常賦予矩陣粗體大寫(xiě)變量名稱(chēng),比如A。如果一個(gè)矩陣高度是m,寬度是n,那么說(shuō)A∈Rm×n。一個(gè)矩陣可以表示如下:
張量(tensor):某些情況下,我們會(huì)討論不止維坐標(biāo)的數(shù)組。如果一組數(shù)組中的元素分布在若干維坐標(biāo)的規(guī)則網(wǎng)絡(luò)中,就將其稱(chēng)為張量。用A表示,如張量中坐標(biāo)為(i,j,k)的元素記作Ai,j,k。
轉(zhuǎn)置(transpose):矩陣的轉(zhuǎn)置是以對(duì)角線為軸的鏡像,這條從左上角到右下角的對(duì)角線稱(chēng)為主對(duì)角線(main diagonal)。將矩陣A
的轉(zhuǎn)置表示為A?
。定義如下:
A=???x11x21x31x12x22x32????A?=[x11x21x21x22x31x32]
2.2 矩陣和向量相乘
矩陣乘法是矩陣運(yùn)算中最重要的操作之一。兩個(gè)矩陣A
和B的矩陣乘積(matrix product)是第三個(gè)矩陣C。矩陣乘法中A的列必須和B的行數(shù)相同。即如果矩陣A的形狀是m×n,矩陣B的形狀是n×p,那么矩陣C的形狀就是m×p
。即
具體的地,其中的乘法操作定義為
矩陣乘積服從分配律
矩陣乘積也服從結(jié)合律
注意:矩陣乘積沒(méi)有交換律
點(diǎn)積(dot product)兩個(gè)相同維數(shù)的向量x
和y的點(diǎn)積可看作是矩陣乘積x?y
矩陣乘積的轉(zhuǎn)置
利用向量的乘積是標(biāo)量,標(biāo)量的轉(zhuǎn)置是自身的事實(shí),我們可以證明(10)式:
線性方程組
Ax=b
2.3 單位矩陣和逆矩陣
線性代數(shù)中提供了矩陣逆(matrix inverse)的工具,使得我們能夠解析地求解(11)中的A
.
單位矩陣(identity matrix):任意向量與單位矩陣相乘都不會(huì)改變。我們將保持n
維向量不變地單位矩陣記作為In,形式上In∈Rn×n
,
矩陣A的矩陣逆被記作A?1,被定義為如下形式:
(11)式方程組的求解:
方程組的解取決于能否找到一個(gè)逆矩陣A?1。接下來(lái)討論逆矩陣A?1的存在的條件。
2.4 線性相關(guān)和生成子空間
如果逆矩陣A?1
存在,那么(11)式肯定對(duì)于每一個(gè)向量b恰好存在一個(gè)解。分析方程有多少個(gè)解,我們可以看成是A
的列向量的線性組合(linear combination)。
形式上,某個(gè)集合中向量的線性組合,是指每個(gè)向量乘以對(duì)應(yīng)系數(shù)之后的和,即
一組向量的生成空間(span)是原始向量線性組合后所能抵達(dá)的點(diǎn)的集合。
線性無(wú)關(guān)(linearly independent): 如果一組向量中的任意一個(gè)向量都不能表示成其他向量的線性組合,那么這組向量被稱(chēng)之為線性無(wú)關(guān)。
要想使矩陣可逆,首先必須矩陣是一個(gè)方陣(square),即m=n
,其次,所有的列向量都是線性無(wú)關(guān)的。
一個(gè)列向量線性相關(guān)的方陣被稱(chēng)為奇異的(singular)。
2.5 范數(shù)
有時(shí)候我們需要衡量一個(gè)向量的大小,在機(jī)器學(xué)習(xí)中,我們使用稱(chēng)為范數(shù)(norm)的函數(shù)來(lái)衡量矩陣大小,形式上,Lp
范數(shù)如下:
其中p∈R,p≥1。
范數(shù)是將向量映射到非負(fù)值的函數(shù)。直觀上來(lái)說(shuō),向量x
的范數(shù)就是衡量從原點(diǎn)到x
的舉例。更嚴(yán)格來(lái)說(shuō),范數(shù)滿(mǎn)足下列性質(zhì)的函數(shù):
當(dāng)p=2
時(shí),L2被稱(chēng)作歐幾里得范數(shù)(Euclidean norm)。它表示從原點(diǎn)出發(fā)到向量x確定的點(diǎn)的歐幾里得距離。平方L2范數(shù)常被用來(lái)衡量向量的大小,因?yàn)樗阌谇髮?dǎo)計(jì)算(如對(duì)向量中每個(gè)元素的導(dǎo)數(shù)只取決于對(duì)應(yīng)的元素,但是它也有缺陷,即它在原點(diǎn)附近增長(zhǎng)得十分緩慢),可以簡(jiǎn)單用點(diǎn)積x?x來(lái)計(jì)算。
max 范數(shù)(max norm):這個(gè)范數(shù)表示向量中具有最大幅度得元素的絕對(duì)值,用L∞
范數(shù)表示,期形式為:
x?y=||x||2||y||2cosθ
2.6 特殊類(lèi)型的矩陣和向量
對(duì)角矩陣(diagonal matrix)只在主對(duì)角線上含有非零元素,其它位置都是零。矩陣D
是對(duì)角矩陣,當(dāng)且僅當(dāng)?i≠j,Di,j=0,用diag(v)表示一個(gè)對(duì)角元素由向量v中元素給定的對(duì)角矩陣。
對(duì)稱(chēng)(symmetric) 矩陣是任意轉(zhuǎn)置和自己相等的矩陣:
單位向量(unit vector)是具有單位范數(shù)(unit norm)的向量:
正交矩陣(orthonormal matrix)是指行向量是標(biāo)準(zhǔn)正交的,列向量是標(biāo)準(zhǔn)正交的方陣:
所以正交矩陣受到關(guān)注是因?yàn)榍竽嬗?jì)算代價(jià)小。需要注意正交矩陣的定義。反直覺(jué)地,正交矩陣的行向量不僅是正交的,還是標(biāo)準(zhǔn)正交的。對(duì)于行向量或列向量互相正交但不是標(biāo)準(zhǔn)正交的矩陣沒(méi)有對(duì)應(yīng)的專(zhuān)有術(shù)語(yǔ)。
2.7 特征分解
許多數(shù)學(xué)對(duì)象可以通過(guò)將它們分解成多個(gè)組成部分,或者找到它們的一些屬性而被更好地理解,這些屬性是通用的,而不是由我們選擇表示它們的方式引起的。就像我們可以通過(guò)分解質(zhì)因數(shù)來(lái)發(fā)現(xiàn)一些關(guān)于整數(shù)的真實(shí)性質(zhì),我們也可以通過(guò)分解矩陣來(lái)獲取一些矩陣表示成數(shù)組元素時(shí)不明顯的函數(shù)性質(zhì)。
特征分解(eigendecomposition)是使用最廣的矩陣分解之一,即我們將矩陣分解成一組特征向量和特征值。
方陣A
的特征向量(eigenvector)是指與A相乘后相當(dāng)于對(duì)該向量進(jìn)行縮放的非零向量v:
如果v
是A的特征向量,那么任何放縮后的向量sv(s∈R,s≠0)也是A的特征向量并且其與\bf v 有相同的特征值。所以我們通常只考慮單位特征向量。
假設(shè)矩陣A
有n個(gè)線性無(wú)關(guān)的特征向量{v(1),v(2),...,v(n)},對(duì)應(yīng)著的特征值{λ1,λ2,...,λn},我們將特征向量連成一個(gè)矩陣,使得每一列是一個(gè)特征向量:
不是每一個(gè)矩陣都可以分解成特征值和特征向量,在某些情況下,特征分解會(huì)涉及到復(fù)數(shù),而非實(shí)數(shù)。在本書(shū)的機(jī)器學(xué)習(xí)學(xué)習(xí)中,我們只討論一類(lèi)簡(jiǎn)單分解的矩陣。具體就是,每個(gè)實(shí)對(duì)稱(chēng)矩陣都可以分解為實(shí)特征向量和實(shí)特征值:
2.8 跡運(yùn)算
跡運(yùn)算返回的是矩陣對(duì)角元素的和:
標(biāo)量的跡是它本身:a=Tr(a)。
2.9 行列式
行列式,記作det(A)
,是一個(gè)將方陣A映射到實(shí)數(shù)的函數(shù)。行列式等于矩陣特征值的乘積。行列式的絕對(duì)值可以被認(rèn)為是衡量矩陣相乘后空間擴(kuò)大或者縮小了多少。如果行列式是0, 那么空間至少沿著某一維完全收縮了,使其失去了所有的體積。如果行列式是1, 那么矩陣相乘沒(méi)有改變空間體積。
總結(jié)
以上是在機(jī)器學(xué)習(xí)過(guò)程中必須了解和掌握的有關(guān)線性代數(shù)的知識(shí)
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10