
作者 | Oleksii Kharkovyna
編譯 | 機(jī)器之心
線性代數(shù)是 AI 專家必須掌握的知識,這已不再是個(gè)秘密。如果不掌握應(yīng)用數(shù)學(xué)這個(gè)領(lǐng)域,你永遠(yuǎn)就只能是「門外漢」。當(dāng)然,學(xué)習(xí)線性代數(shù)道阻且長。數(shù)學(xué),尤其是線性代數(shù)常與枯燥、復(fù)雜和毫無意義的事物聯(lián)系起來。不過你還可以另辟蹊徑。
閱讀完本文后,你將了解到:
給初學(xué)者的解釋:線性代數(shù)的本質(zhì)
第一次接觸線性代數(shù)的人,通常會覺得線性代數(shù)長這樣:
看起來就讓人頭大?你的腦海隨即會浮現(xiàn)出兩個(gè)問題:它們都是從哪兒來的?為什么需要這些運(yùn)算?
讓我們做個(gè)簡單的練習(xí)。
線性代數(shù)是計(jì)算數(shù)學(xué)的「主力軍」。我舉個(gè)簡單的例子來說明。
假設(shè)我們有一根兩端固定的極細(xì)金屬棒,其溫度恒等于零。我們開始使用分布式熱源對棒進(jìn)行加熱,該熱源在點(diǎn) x 的附近,每單位長度每秒產(chǎn)生 q (x) 焦耳熱量。溫度 t = t (x) 公式該怎么建立?先粗略建模:熱量平衡后,設(shè)點(diǎn) x 的分段為 [x-h, x + h],來自熱源的熱流入應(yīng)等于分段兩端的熱通量之和。如果 h 足夠小,那么熱通量可以看作常量(包含 h),該等式可以寫成如下形式:
其中 Q_x-h 是通過左邊界的熱通量,Q_x + h 是通過右邊界的熱通量。根據(jù)傅立葉定律,熱通量與溫度差成正比(畢竟,你剛跳進(jìn)水里時(shí)感覺最冷)。因此:
令 h = 1 /N。假設(shè) xi = i · h,其中 i =0, 1, 2, …, N,它們被稱為網(wǎng)格。變量 ti = t (xi) 將滿足方程式:
基于邊界條件且 qi = q (xi),得到線性方程組:
具體來說,這個(gè)系統(tǒng)可以通過掃描法「正面」解決,但是在實(shí)際模型中,系統(tǒng)變得更加復(fù)雜。線性代數(shù)正好發(fā)揮了作用:
用 A · y = b 的簡短形式描述系統(tǒng)(這是矩陣乘法的由來?。?;
了解是否有解決方案,以及解決方案是否唯一;
(在本例中)使用簡單公式 y = A-1 b 來建模,將 A 看做一個(gè)數(shù)字;
(引入計(jì)算數(shù)學(xué))建立用于求解線性方程組的有效數(shù)值方法。
這只是從數(shù)學(xué)建模的角度看線性代數(shù),還有量子力學(xué)、統(tǒng)計(jì)學(xué)等多個(gè)角度。
再以著名問題為例,即某網(wǎng)站(或整個(gè)互聯(lián)網(wǎng))的「網(wǎng)頁引用排名」問題。
假設(shè)有 N 個(gè)頁面,每頁可能包含到其他頁面的鏈接。我們的任務(wù)是確定哪些頁面最重要。如何準(zhǔn)確地衡量「重要性」是任務(wù)的一部分。我們將以非負(fù)數(shù)(權(quán)重)來定量表示。先假設(shè):此頁面的鏈接越多,其權(quán)重就越大。這種方法有個(gè)缺點(diǎn):我們沒有考慮鏈接頁面的權(quán)重。一個(gè)鏈接權(quán)重越大,其意義也越大,這是合乎邏輯的??紤]到這些因素,我們選擇以下模型:
其中 a_ij 是第 i 頁到第 j 頁的鏈接數(shù),除以第 j 頁的鏈接總數(shù)。該公式可以理解為:第 i 頁的權(quán)重等于第 j 頁的權(quán)重與從第 j 頁到第 i 頁的鏈接之比的乘積之和。因此,我們將問題簡化為線性方程組。此外,權(quán)重向量 p 是矩陣 A 的特征向量,對應(yīng)特征值為 1:p = Ap
Frobenius-Perron 定理保證了該向量的存在(嚴(yán)格來說,矩陣 A 略有修改),通過簡單的迭代即可找到。
因此,線性代數(shù)是一套非常通用的思想和工具,可以應(yīng)用于各個(gè)領(lǐng)域。但是「天下沒有免費(fèi)的午餐」,通用性的代價(jià)是:某些定義和定理有著毫無必要的復(fù)雜度。不過事實(shí)并非如此:實(shí)際上,許多抽象目的是簡化而非復(fù)雜化?!溉绻雌饋硐聒喿?,像鴨子一樣游泳,像鴨子一樣嘎嘎叫,那么它可能就是鴨子」這實(shí)際上就是一種抽象,如果你習(xí)慣了這種抽象概念,將會非常方便。線性代數(shù)也是一樣。為了更具體地說明這一點(diǎn),讓我們簡短討論下內(nèi)部來補(bǔ)充一下「外部檢查」。
一些你需要知道的線性代數(shù)理論
線性代數(shù)研究的是向量空間以及將一個(gè)向量空間映射到另一個(gè)向量空間的函數(shù)。我們主要考慮線性函數(shù)(對于任何常數(shù)α和β以及向量 x 和 y,滿足關(guān)系 f (α · x + β · y) = α · f (x) + β · f (y)。也有非線性的函數(shù)(例如二次方程),不過首先你需要知道什么是向量(以及向量空間),這不像看上去那么簡單。
教材和課程中通常只是給出一個(gè)抽象的定義,這一定義又常常由 8 點(diǎn)構(gòu)成。有時(shí)一個(gè)矢量空間被視作一個(gè)使用加號的阿貝爾群,該阿貝爾群滿足四大群公理,并定義了標(biāo)量乘法。但是對于剛開始研究線性代數(shù)的人來說,理解這些著實(shí)困難,學(xué)習(xí)一些具體示例并進(jìn)行類比要容易得多。8 條的定義僅僅是這種類比的形式。所以我們舉個(gè)例子吧:
向量,是我們每個(gè)人都熟悉的有向線段,多個(gè)有向線段可以組成一個(gè)向量空間。回憶一下多項(xiàng)式,它們可以進(jìn)行通項(xiàng)相加以及系數(shù)相乘。請注意:從代數(shù)的角度來看,這些多項(xiàng)式的加法運(yùn)算以及多項(xiàng)式與系數(shù)的乘法運(yùn)算,與有向線段運(yùn)算規(guī)則是完全一致的。例如,等式 x + y = y + x(加法交換性)對有向線段和多項(xiàng)式均成立。因此,多項(xiàng)式的集合是向量空間,而多項(xiàng)式就是向量。
既然多項(xiàng)式類似于有向線段,那么它們也肯定有坐標(biāo)。但是如何獲知多項(xiàng)式的坐標(biāo)以及多項(xiàng)式有多少個(gè)坐標(biāo)呢?眾所周知,每個(gè)向量在平面上都有兩個(gè)坐標(biāo),在空間中則是三個(gè)。為什么會這樣呢?維度又是什么?線性代數(shù)給出了一個(gè)答案:維度就是線性無關(guān)向量的最大數(shù)量。線性無關(guān)是什么意思?如果存在數(shù)字α1, α2, …, αn,其中至少一個(gè)非零,則向量 x1, x2, …, xn 被稱為線性相關(guān)。
如果向量不線性相關(guān),則稱它們?yōu)榫€性獨(dú)立。(線性相關(guān)性的概念概括了平行向量和共面向量的概念:兩個(gè)向量在當(dāng)且僅當(dāng)它們平行時(shí)才線性相關(guān)。三個(gè)向量在當(dāng)且僅當(dāng)它們共面時(shí)才線性相關(guān)。)
空間的維數(shù)可以是有限的(維數(shù)不大于 N 的多項(xiàng)式空間),也可以是無限的(所有多項(xiàng)式空間)。這兩種情況在實(shí)際中都會出現(xiàn),但現(xiàn)在我們限制其為有限維的。令向量 x1, x2, …, xn 線性無關(guān),n 為空間維數(shù)。任何其他向量 x 都可以唯一地寫為 x1, x2, …, xn 的線性組合,相應(yīng)的線性組合的系數(shù)稱為坐標(biāo)。
現(xiàn)在,我們對坐標(biāo)有了嚴(yán)格的定義,但重點(diǎn)不只是這個(gè):在此過程中,我們遇到了更基本(更易忽略)的線性組合和線性相關(guān)性的概念。而且我們還了解到,在 n 維線性空間中,最多只能有 n 個(gè)線性無關(guān)向量。這是線性代數(shù)的基礎(chǔ)之一。
我們知道的仍只是「冰山一角」。但是現(xiàn)在我們可以解決那些顯然與線性代數(shù)無關(guān)的問題了。例如:給定多項(xiàng)式 p 和 q;是否在兩個(gè)變量 R = R (x, y) 中存在多項(xiàng)式,使得對于所有 t 都有 R (p (t), q (t)) = 0?
「示例」基本結(jié)束了,但仍然有必要講講研究線性代數(shù)的各種方法。我簡短回顧一下自己的經(jīng)歷,提出幾點(diǎn)建議。
最重要的問題:AI 真的需要線性代數(shù)嗎?
這取決于你的目的。如果你只想把人工智能和機(jī)器學(xué)習(xí)的工具當(dāng)作一個(gè)黑匣子,那么你只需要足夠的數(shù)學(xué)計(jì)算就可以確定你的問題是否符合模型使用。
如果你想提出新想法,線性代數(shù)則是你必須要學(xué)習(xí)的東西。并不是說你需要學(xué)習(xí)有關(guān)數(shù)學(xué)的所有知識,這樣會耽擱于此,失去研究其他更重要的東西(如微積分/統(tǒng)計(jì))的動力。
你的目標(biāo)應(yīng)該是使用線性代數(shù)來找到點(diǎn)與點(diǎn)之間的最短路徑。以下是你所需要掌握的知識列表:
標(biāo)量、向量、張量:求模(大小)、向量夾角(點(diǎn)積或內(nèi)積)、一個(gè)向量在另一向量上的投影以及依據(jù)自定義的軸向量對向量的描述和表示
矩陣:矩陣可以將向量的描述從一組基(一組坐標(biāo)軸)轉(zhuǎn)換為另一組基。例如,找出如何將映射應(yīng)用到圖像上并處理圖像。
矩陣中的長度平方采樣、奇異值分解、低秩逼近是數(shù)據(jù)處理中廣泛采用的幾種方法。
SVD 通常用于主成分分析(PCA)中,而主成分分析又被廣泛用于特征提取以及了解特征或?qū)傩灾g的關(guān)系對于結(jié)果的重要性上。
線性代數(shù)在機(jī)器學(xué)習(xí)中的應(yīng)用實(shí)例
以下是線性代數(shù)的一些具體示例:
數(shù)據(jù)集和數(shù)據(jù)文件
例如在機(jī)器學(xué)習(xí)中,將模型擬合到一組由數(shù)字組成的類似表格的數(shù)據(jù)集上,其中每一行代表一個(gè)觀測結(jié)果,每一列代表該觀測值的特征。你發(fā)現(xiàn)相似之處了么?這些數(shù)據(jù)實(shí)際上是一個(gè)矩陣:是線性代數(shù)中的一種關(guān)鍵的數(shù)據(jù)結(jié)構(gòu)。
圖像和照片
你處理的每個(gè)圖像本身就是一個(gè)表結(jié)構(gòu),對于黑白圖像,每個(gè)單元格中有一個(gè)寬度和高度以及一個(gè)像素值,而彩色圖像每個(gè)單元格中有三個(gè)像素值。照片是線性代數(shù)矩陣的另一個(gè)例子。
獨(dú)熱編碼
獨(dú)熱編碼是分類變量中的一種很流行的編碼。獨(dú)熱編碼是創(chuàng)建表來表示變量,其中每一列表示一個(gè)類別,每一行表示數(shù)據(jù)集中的一個(gè)樣本。
線性回歸是統(tǒng)計(jì)學(xué)中描述變量之間關(guān)系的一種舊方法。在機(jī)器學(xué)習(xí)中,它通常用于預(yù)測簡單回歸問題中的數(shù)值。
線性代數(shù)是描述深度學(xué)習(xí)方法的核心,通過矩陣表示法來實(shí)現(xiàn)深度學(xué)習(xí)方法,例如谷歌的 TensorFlow Python 庫,其名稱中就有「tensor」一詞。
結(jié)論
下面是我在學(xué)習(xí)這些并不簡單的數(shù)學(xué)內(nèi)容時(shí)總結(jié)的技巧:
線性代數(shù)的基本概念和定理并非從零開始。努力理解本質(zhì)、內(nèi)部邏輯對拓寬你在這個(gè)主題上的視角很有用??巳R默(Cramer)、高斯(Gauss)、皮亞諾(Peano)等等許多人肯定從中發(fā)現(xiàn)了樂趣(他們首先取悅了自己),所以學(xué)習(xí)線性代數(shù)的人怎么會感到無聊呢?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03