
作者 | Oleksii Kharkovyna
編譯 | 機(jī)器之心
線性代數(shù)是 AI 專家必須掌握的知識(shí),這已不再是個(gè)秘密。如果不掌握應(yīng)用數(shù)學(xué)這個(gè)領(lǐng)域,你永遠(yuǎn)就只能是「門外漢」。當(dāng)然,學(xué)習(xí)線性代數(shù)道阻且長。數(shù)學(xué),尤其是線性代數(shù)常與枯燥、復(fù)雜和毫無意義的事物聯(lián)系起來。不過你還可以另辟蹊徑。
閱讀完本文后,你將了解到:
給初學(xué)者的解釋:線性代數(shù)的本質(zhì)
第一次接觸線性代數(shù)的人,通常會(huì)覺得線性代數(shù)長這樣:
看起來就讓人頭大?你的腦海隨即會(huì)浮現(xiàn)出兩個(gè)問題:它們都是從哪兒來的?為什么需要這些運(yùn)算?
讓我們做個(gè)簡單的練習(xí)。
線性代數(shù)是計(jì)算數(shù)學(xué)的「主力軍」。我舉個(gè)簡單的例子來說明。
假設(shè)我們有一根兩端固定的極細(xì)金屬棒,其溫度恒等于零。我們開始使用分布式熱源對棒進(jìn)行加熱,該熱源在點(diǎn) x 的附近,每單位長度每秒產(chǎn)生 q (x) 焦耳熱量。溫度 t = t (x) 公式該怎么建立?先粗略建模:熱量平衡后,設(shè)點(diǎn) x 的分段為 [x-h, x + h],來自熱源的熱流入應(yīng)等于分段兩端的熱通量之和。如果 h 足夠小,那么熱通量可以看作常量(包含 h),該等式可以寫成如下形式:
其中 Q_x-h 是通過左邊界的熱通量,Q_x + h 是通過右邊界的熱通量。根據(jù)傅立葉定律,熱通量與溫度差成正比(畢竟,你剛跳進(jìn)水里時(shí)感覺最冷)。因此:
令 h = 1 /N。假設(shè) xi = i · h,其中 i =0, 1, 2, …, N,它們被稱為網(wǎng)格。變量 ti = t (xi) 將滿足方程式:
基于邊界條件且 qi = q (xi),得到線性方程組:
具體來說,這個(gè)系統(tǒng)可以通過掃描法「正面」解決,但是在實(shí)際模型中,系統(tǒng)變得更加復(fù)雜。線性代數(shù)正好發(fā)揮了作用:
用 A · y = b 的簡短形式描述系統(tǒng)(這是矩陣乘法的由來?。?;
了解是否有解決方案,以及解決方案是否唯一;
(在本例中)使用簡單公式 y = A-1 b 來建模,將 A 看做一個(gè)數(shù)字;
(引入計(jì)算數(shù)學(xué))建立用于求解線性方程組的有效數(shù)值方法。
這只是從數(shù)學(xué)建模的角度看線性代數(shù),還有量子力學(xué)、統(tǒng)計(jì)學(xué)等多個(gè)角度。
再以著名問題為例,即某網(wǎng)站(或整個(gè)互聯(lián)網(wǎng))的「網(wǎng)頁引用排名」問題。
假設(shè)有 N 個(gè)頁面,每頁可能包含到其他頁面的鏈接。我們的任務(wù)是確定哪些頁面最重要。如何準(zhǔn)確地衡量「重要性」是任務(wù)的一部分。我們將以非負(fù)數(shù)(權(quán)重)來定量表示。先假設(shè):此頁面的鏈接越多,其權(quán)重就越大。這種方法有個(gè)缺點(diǎn):我們沒有考慮鏈接頁面的權(quán)重。一個(gè)鏈接權(quán)重越大,其意義也越大,這是合乎邏輯的??紤]到這些因素,我們選擇以下模型:
其中 a_ij 是第 i 頁到第 j 頁的鏈接數(shù),除以第 j 頁的鏈接總數(shù)。該公式可以理解為:第 i 頁的權(quán)重等于第 j 頁的權(quán)重與從第 j 頁到第 i 頁的鏈接之比的乘積之和。因此,我們將問題簡化為線性方程組。此外,權(quán)重向量 p 是矩陣 A 的特征向量,對應(yīng)特征值為 1:p = Ap
Frobenius-Perron 定理保證了該向量的存在(嚴(yán)格來說,矩陣 A 略有修改),通過簡單的迭代即可找到。
因此,線性代數(shù)是一套非常通用的思想和工具,可以應(yīng)用于各個(gè)領(lǐng)域。但是「天下沒有免費(fèi)的午餐」,通用性的代價(jià)是:某些定義和定理有著毫無必要的復(fù)雜度。不過事實(shí)并非如此:實(shí)際上,許多抽象目的是簡化而非復(fù)雜化。「如果它看起來像鴨子,像鴨子一樣游泳,像鴨子一樣嘎嘎叫,那么它可能就是鴨子」這實(shí)際上就是一種抽象,如果你習(xí)慣了這種抽象概念,將會(huì)非常方便。線性代數(shù)也是一樣。為了更具體地說明這一點(diǎn),讓我們簡短討論下內(nèi)部來補(bǔ)充一下「外部檢查」。
一些你需要知道的線性代數(shù)理論
線性代數(shù)研究的是向量空間以及將一個(gè)向量空間映射到另一個(gè)向量空間的函數(shù)。我們主要考慮線性函數(shù)(對于任何常數(shù)α和β以及向量 x 和 y,滿足關(guān)系 f (α · x + β · y) = α · f (x) + β · f (y)。也有非線性的函數(shù)(例如二次方程),不過首先你需要知道什么是向量(以及向量空間),這不像看上去那么簡單。
教材和課程中通常只是給出一個(gè)抽象的定義,這一定義又常常由 8 點(diǎn)構(gòu)成。有時(shí)一個(gè)矢量空間被視作一個(gè)使用加號(hào)的阿貝爾群,該阿貝爾群滿足四大群公理,并定義了標(biāo)量乘法。但是對于剛開始研究線性代數(shù)的人來說,理解這些著實(shí)困難,學(xué)習(xí)一些具體示例并進(jìn)行類比要容易得多。8 條的定義僅僅是這種類比的形式。所以我們舉個(gè)例子吧:
向量,是我們每個(gè)人都熟悉的有向線段,多個(gè)有向線段可以組成一個(gè)向量空間。回憶一下多項(xiàng)式,它們可以進(jìn)行通項(xiàng)相加以及系數(shù)相乘。請注意:從代數(shù)的角度來看,這些多項(xiàng)式的加法運(yùn)算以及多項(xiàng)式與系數(shù)的乘法運(yùn)算,與有向線段運(yùn)算規(guī)則是完全一致的。例如,等式 x + y = y + x(加法交換性)對有向線段和多項(xiàng)式均成立。因此,多項(xiàng)式的集合是向量空間,而多項(xiàng)式就是向量。
既然多項(xiàng)式類似于有向線段,那么它們也肯定有坐標(biāo)。但是如何獲知多項(xiàng)式的坐標(biāo)以及多項(xiàng)式有多少個(gè)坐標(biāo)呢?眾所周知,每個(gè)向量在平面上都有兩個(gè)坐標(biāo),在空間中則是三個(gè)。為什么會(huì)這樣呢?維度又是什么?線性代數(shù)給出了一個(gè)答案:維度就是線性無關(guān)向量的最大數(shù)量。線性無關(guān)是什么意思?如果存在數(shù)字α1, α2, …, αn,其中至少一個(gè)非零,則向量 x1, x2, …, xn 被稱為線性相關(guān)。
如果向量不線性相關(guān),則稱它們?yōu)榫€性獨(dú)立。(線性相關(guān)性的概念概括了平行向量和共面向量的概念:兩個(gè)向量在當(dāng)且僅當(dāng)它們平行時(shí)才線性相關(guān)。三個(gè)向量在當(dāng)且僅當(dāng)它們共面時(shí)才線性相關(guān)。)
空間的維數(shù)可以是有限的(維數(shù)不大于 N 的多項(xiàng)式空間),也可以是無限的(所有多項(xiàng)式空間)。這兩種情況在實(shí)際中都會(huì)出現(xiàn),但現(xiàn)在我們限制其為有限維的。令向量 x1, x2, …, xn 線性無關(guān),n 為空間維數(shù)。任何其他向量 x 都可以唯一地寫為 x1, x2, …, xn 的線性組合,相應(yīng)的線性組合的系數(shù)稱為坐標(biāo)。
現(xiàn)在,我們對坐標(biāo)有了嚴(yán)格的定義,但重點(diǎn)不只是這個(gè):在此過程中,我們遇到了更基本(更易忽略)的線性組合和線性相關(guān)性的概念。而且我們還了解到,在 n 維線性空間中,最多只能有 n 個(gè)線性無關(guān)向量。這是線性代數(shù)的基礎(chǔ)之一。
我們知道的仍只是「冰山一角」。但是現(xiàn)在我們可以解決那些顯然與線性代數(shù)無關(guān)的問題了。例如:給定多項(xiàng)式 p 和 q;是否在兩個(gè)變量 R = R (x, y) 中存在多項(xiàng)式,使得對于所有 t 都有 R (p (t), q (t)) = 0?
「示例」基本結(jié)束了,但仍然有必要講講研究線性代數(shù)的各種方法。我簡短回顧一下自己的經(jīng)歷,提出幾點(diǎn)建議。
最重要的問題:AI 真的需要線性代數(shù)嗎?
這取決于你的目的。如果你只想把人工智能和機(jī)器學(xué)習(xí)的工具當(dāng)作一個(gè)黑匣子,那么你只需要足夠的數(shù)學(xué)計(jì)算就可以確定你的問題是否符合模型使用。
如果你想提出新想法,線性代數(shù)則是你必須要學(xué)習(xí)的東西。并不是說你需要學(xué)習(xí)有關(guān)數(shù)學(xué)的所有知識(shí),這樣會(huì)耽擱于此,失去研究其他更重要的東西(如微積分/統(tǒng)計(jì))的動(dòng)力。
你的目標(biāo)應(yīng)該是使用線性代數(shù)來找到點(diǎn)與點(diǎn)之間的最短路徑。以下是你所需要掌握的知識(shí)列表:
標(biāo)量、向量、張量:求模(大小)、向量夾角(點(diǎn)積或內(nèi)積)、一個(gè)向量在另一向量上的投影以及依據(jù)自定義的軸向量對向量的描述和表示
矩陣:矩陣可以將向量的描述從一組基(一組坐標(biāo)軸)轉(zhuǎn)換為另一組基。例如,找出如何將映射應(yīng)用到圖像上并處理圖像。
矩陣中的長度平方采樣、奇異值分解、低秩逼近是數(shù)據(jù)處理中廣泛采用的幾種方法。
SVD 通常用于主成分分析(PCA)中,而主成分分析又被廣泛用于特征提取以及了解特征或?qū)傩灾g的關(guān)系對于結(jié)果的重要性上。
線性代數(shù)在機(jī)器學(xué)習(xí)中的應(yīng)用實(shí)例
以下是線性代數(shù)的一些具體示例:
數(shù)據(jù)集和數(shù)據(jù)文件
例如在機(jī)器學(xué)習(xí)中,將模型擬合到一組由數(shù)字組成的類似表格的數(shù)據(jù)集上,其中每一行代表一個(gè)觀測結(jié)果,每一列代表該觀測值的特征。你發(fā)現(xiàn)相似之處了么?這些數(shù)據(jù)實(shí)際上是一個(gè)矩陣:是線性代數(shù)中的一種關(guān)鍵的數(shù)據(jù)結(jié)構(gòu)。
圖像和照片
你處理的每個(gè)圖像本身就是一個(gè)表結(jié)構(gòu),對于黑白圖像,每個(gè)單元格中有一個(gè)寬度和高度以及一個(gè)像素值,而彩色圖像每個(gè)單元格中有三個(gè)像素值。照片是線性代數(shù)矩陣的另一個(gè)例子。
獨(dú)熱編碼
獨(dú)熱編碼是分類變量中的一種很流行的編碼。獨(dú)熱編碼是創(chuàng)建表來表示變量,其中每一列表示一個(gè)類別,每一行表示數(shù)據(jù)集中的一個(gè)樣本。
線性回歸是統(tǒng)計(jì)學(xué)中描述變量之間關(guān)系的一種舊方法。在機(jī)器學(xué)習(xí)中,它通常用于預(yù)測簡單回歸問題中的數(shù)值。
線性代數(shù)是描述深度學(xué)習(xí)方法的核心,通過矩陣表示法來實(shí)現(xiàn)深度學(xué)習(xí)方法,例如谷歌的 TensorFlow Python 庫,其名稱中就有「tensor」一詞。
結(jié)論
下面是我在學(xué)習(xí)這些并不簡單的數(shù)學(xué)內(nèi)容時(shí)總結(jié)的技巧:
線性代數(shù)的基本概念和定理并非從零開始。努力理解本質(zhì)、內(nèi)部邏輯對拓寬你在這個(gè)主題上的視角很有用??巳R默(Cramer)、高斯(Gauss)、皮亞諾(Peano)等等許多人肯定從中發(fā)現(xiàn)了樂趣(他們首先取悅了自己),所以學(xué)習(xí)線性代數(shù)的人怎么會(huì)感到無聊呢?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10