
機(jī)器學(xué)習(xí)中的線性代數(shù)
線性代數(shù)作為數(shù)學(xué)中的一個重要的分支,廣發(fā)應(yīng)用在科學(xué)與工程中。掌握好線性代數(shù)對于理解和從事機(jī)器學(xué)習(xí)算法相關(guān)的工作是很有必要的,尤其是對于深度學(xué)習(xí)而言。因此,在開始介紹深度學(xué)習(xí)之前,先集中探討一些必備的線性代數(shù)知識。
2.1 標(biāo)量,向量,矩陣和張量
標(biāo)量(scalar):一個標(biāo)量就是一個單獨的數(shù)。用斜體表示標(biāo)量,如s∈R
.
向量(vector):一個向量是一列數(shù),我們用粗體的小寫名稱表示向量。比如x
,將向量x
寫成方括號包含的縱柱:
矩陣(matrix):矩陣是二維數(shù)組,我們通常賦予矩陣粗體大寫變量名稱,比如A。如果一個矩陣高度是m,寬度是n,那么說A∈Rm×n。一個矩陣可以表示如下:
張量(tensor):某些情況下,我們會討論不止維坐標(biāo)的數(shù)組。如果一組數(shù)組中的元素分布在若干維坐標(biāo)的規(guī)則網(wǎng)絡(luò)中,就將其稱為張量。用A表示,如張量中坐標(biāo)為(i,j,k)的元素記作Ai,j,k。
轉(zhuǎn)置(transpose):矩陣的轉(zhuǎn)置是以對角線為軸的鏡像,這條從左上角到右下角的對角線稱為主對角線(main diagonal)。將矩陣A
的轉(zhuǎn)置表示為A?
。定義如下:
A=???x11x21x31x12x22x32????A?=[x11x21x21x22x31x32]
2.2 矩陣和向量相乘
矩陣乘法是矩陣運算中最重要的操作之一。兩個矩陣A
和B的矩陣乘積(matrix product)是第三個矩陣C。矩陣乘法中A的列必須和B的行數(shù)相同。即如果矩陣A的形狀是m×n,矩陣B的形狀是n×p,那么矩陣C的形狀就是m×p
。即
具體的地,其中的乘法操作定義為
矩陣乘積服從分配律
矩陣乘積也服從結(jié)合律
注意:矩陣乘積沒有交換律
點積(dot product)兩個相同維數(shù)的向量x
和y的點積可看作是矩陣乘積x?y
矩陣乘積的轉(zhuǎn)置
利用向量的乘積是標(biāo)量,標(biāo)量的轉(zhuǎn)置是自身的事實,我們可以證明(10)式:
線性方程組
Ax=b
2.3 單位矩陣和逆矩陣
線性代數(shù)中提供了矩陣逆(matrix inverse)的工具,使得我們能夠解析地求解(11)中的A
.
單位矩陣(identity matrix):任意向量與單位矩陣相乘都不會改變。我們將保持n
維向量不變地單位矩陣記作為In,形式上In∈Rn×n
,
矩陣A的矩陣逆被記作A?1,被定義為如下形式:
(11)式方程組的求解:
方程組的解取決于能否找到一個逆矩陣A?1。接下來討論逆矩陣A?1的存在的條件。
2.4 線性相關(guān)和生成子空間
如果逆矩陣A?1
存在,那么(11)式肯定對于每一個向量b恰好存在一個解。分析方程有多少個解,我們可以看成是A
的列向量的線性組合(linear combination)。
形式上,某個集合中向量的線性組合,是指每個向量乘以對應(yīng)系數(shù)之后的和,即
一組向量的生成空間(span)是原始向量線性組合后所能抵達(dá)的點的集合。
線性無關(guān)(linearly independent): 如果一組向量中的任意一個向量都不能表示成其他向量的線性組合,那么這組向量被稱之為線性無關(guān)。
要想使矩陣可逆,首先必須矩陣是一個方陣(square),即m=n
,其次,所有的列向量都是線性無關(guān)的。
一個列向量線性相關(guān)的方陣被稱為奇異的(singular)。
2.5 范數(shù)
有時候我們需要衡量一個向量的大小,在機(jī)器學(xué)習(xí)中,我們使用稱為范數(shù)(norm)的函數(shù)來衡量矩陣大小,形式上,Lp
范數(shù)如下:
其中p∈R,p≥1。
范數(shù)是將向量映射到非負(fù)值的函數(shù)。直觀上來說,向量x
的范數(shù)就是衡量從原點到x
的舉例。更嚴(yán)格來說,范數(shù)滿足下列性質(zhì)的函數(shù):
當(dāng)p=2
時,L2被稱作歐幾里得范數(shù)(Euclidean norm)。它表示從原點出發(fā)到向量x確定的點的歐幾里得距離。平方L2范數(shù)常被用來衡量向量的大小,因為它便于求導(dǎo)計算(如對向量中每個元素的導(dǎo)數(shù)只取決于對應(yīng)的元素,但是它也有缺陷,即它在原點附近增長得十分緩慢),可以簡單用點積x?x來計算。
max 范數(shù)(max norm):這個范數(shù)表示向量中具有最大幅度得元素的絕對值,用L∞
范數(shù)表示,期形式為:
x?y=||x||2||y||2cosθ
2.6 特殊類型的矩陣和向量
對角矩陣(diagonal matrix)只在主對角線上含有非零元素,其它位置都是零。矩陣D
是對角矩陣,當(dāng)且僅當(dāng)?i≠j,Di,j=0,用diag(v)表示一個對角元素由向量v中元素給定的對角矩陣。
對稱(symmetric) 矩陣是任意轉(zhuǎn)置和自己相等的矩陣:
單位向量(unit vector)是具有單位范數(shù)(unit norm)的向量:
正交矩陣(orthonormal matrix)是指行向量是標(biāo)準(zhǔn)正交的,列向量是標(biāo)準(zhǔn)正交的方陣:
所以正交矩陣受到關(guān)注是因為求逆計算代價小。需要注意正交矩陣的定義。反直覺地,正交矩陣的行向量不僅是正交的,還是標(biāo)準(zhǔn)正交的。對于行向量或列向量互相正交但不是標(biāo)準(zhǔn)正交的矩陣沒有對應(yīng)的專有術(shù)語。
2.7 特征分解
許多數(shù)學(xué)對象可以通過將它們分解成多個組成部分,或者找到它們的一些屬性而被更好地理解,這些屬性是通用的,而不是由我們選擇表示它們的方式引起的。就像我們可以通過分解質(zhì)因數(shù)來發(fā)現(xiàn)一些關(guān)于整數(shù)的真實性質(zhì),我們也可以通過分解矩陣來獲取一些矩陣表示成數(shù)組元素時不明顯的函數(shù)性質(zhì)。
特征分解(eigendecomposition)是使用最廣的矩陣分解之一,即我們將矩陣分解成一組特征向量和特征值。
方陣A
的特征向量(eigenvector)是指與A相乘后相當(dāng)于對該向量進(jìn)行縮放的非零向量v:
如果v
是A的特征向量,那么任何放縮后的向量sv(s∈R,s≠0)也是A的特征向量并且其與\bf v 有相同的特征值。所以我們通常只考慮單位特征向量。
假設(shè)矩陣A
有n個線性無關(guān)的特征向量{v(1),v(2),...,v(n)},對應(yīng)著的特征值{λ1,λ2,...,λn}不是每一個矩陣都可以分解成特征值和特征向量,在某些情況下,特征分解會涉及到復(fù)數(shù),而非實數(shù)。在本書的機(jī)器學(xué)習(xí)學(xué)習(xí)中,我們只討論一類簡單分解的矩陣。具體就是,每個實對稱矩陣都可以分解為實特征向量和實特征值:
2.8 跡運算
跡運算返回的是矩陣對角元素的和:
標(biāo)量的跡是它本身:a=Tr(a)。
2.9 行列式
行列式,記作det(A)
,是一個將方陣A映射到實數(shù)的函數(shù)。行列式等于矩陣特征值的乘積。行列式的絕對值可以被認(rèn)為是衡量矩陣相乘后空間擴(kuò)大或者縮小了多少。如果行列式是0, 那么空間至少沿著某一維完全收縮了,使其失去了所有的體積。如果行列式是1, 那么矩陣相乘沒有改變空間體積。
總結(jié)
以上是在機(jī)器學(xué)習(xí)過程中必須了解和掌握的有關(guān)線性代數(shù)的知識
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03