99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁精彩閱讀線性判別分析(Linear Discriminant Analysis, LDA）算法分析

線性判別分析(Linear Discriminant Analysis, LDA）算法分析

2016-04-24

線性判別分析(Linear Discriminant Analysis, LDA）算法分析

一． LDA算法概述：

線性判別式分析(Linear Discriminant Analysis, LDA)，也叫做Fisher線性判別(Fisher Linear Discriminant ,FLD)，是模式識別的經(jīng)典算法，它是在1996年由Belhumeur引入模式識別和人工智能領域的。性鑒別分析的基本思想是將高維的模式樣本投影到最佳鑒別矢量空間，以達到抽取分類信息和壓縮特征空間維數(shù)的效果，投影后保證模式樣本在新的子空間有最大的類間距離和最小的類內(nèi)距離，即模式在該空間中有最佳的可分離性。因此，它是一種有效的特征抽取方法。使用這種方法能夠使投影后模式樣本的類間散布矩陣最大，并且同時類內(nèi)散布矩陣最小。就是說，它能夠保證投影后模式樣本在新的空間中有最小的類內(nèi)距離和最大的類間距離，即模式在該空間中有最佳的可分離性。

二． LDA假設以及符號說明：

假設對于一個空間有m個樣本分別為x1,x2,……xm 即每個x是一個n行的矩陣，其中表示屬于i類的樣本個數(shù)，假設有一個有c個類，則。

Clipboard Image.png

三．公式推導，算法形式化描述

根據(jù)符號說明可得類i的樣本均值為：

Clipboard Image.png

同理我們也可以得到總體樣本均值：

Clipboard Image.png

根據(jù)類間離散度矩陣和類內(nèi)離散度矩陣定義，可以得到如下式子：

Clipboard Image.png

當然還有另一種類間類內(nèi)的離散度矩陣表達方式：

Clipboard Image.png

我們可以知道矩陣的實際意義是一個協(xié)方差矩陣，這個矩陣所刻畫的是該類與樣本總體之間的關系，其中該矩陣對角線上的函數(shù)所代表的是該類相對樣本總體的方差（即分散度），而非對角線上的元素所代表是該類樣本總體均值的協(xié)方差（即該類和總體樣本的相關聯(lián)度或稱冗余度），所以根據(jù)公式（3）可知（3）式即把所有樣本中各個樣本根據(jù)自己所屬的類計算出樣本與總體的協(xié)方差矩陣的總和，這從宏觀上描述了所有類和總體之間的離散冗余程度。同理可以的得出（4）式中為分類內(nèi)各個樣本和所屬類之間的協(xié)方差矩陣之和，它所刻畫的是從總體來看類內(nèi)各個樣本與類之間（這里所刻畫的類特性是由是類內(nèi)各個樣本的平均值矩陣構(gòu)成）離散度，其實從中可以看出不管是類內(nèi)的樣本期望矩陣還是總體樣本期望矩陣，它們都只是充當一個媒介作用，不管是類內(nèi)還是類間離散度矩陣都是從宏觀上刻畫出類與類之間的樣本的離散度和類內(nèi)樣本和樣本之間的離散度。

LDA做為一個分類的算法，我們當然希望它所分的類之間耦合度低，類內(nèi)的聚合度高，即類內(nèi)離散度矩陣的中的數(shù)值要小，而類間離散度矩陣中的數(shù)值要大，這樣的分類的效果才好。

這里我們引入Fisher鑒別準則表達式：

Clipboard Image.png

其中為任一n維列矢量。Fisher線性鑒別分析就是選取使得達到最大值的矢量作為投影方向，其物理意義就是投影后的樣本具有最大的類間離散度和最小的類內(nèi)離散度。

我們把公式（4）和公式（3）代入公式（5）得到：

Clipboard Image.png

四．算法的物理意義和思考

4.1 用一個例子闡述LDA算法在空間上的意義

下面我們利用LDA進行一個分類的問題：假設一個產(chǎn)品有兩個參數(shù)來衡量它是否合格，

我們假設兩個參數(shù)分別為：

Clipboard Image.png

所以我們可以根據(jù)上圖表格把樣本分為兩類，一類是合格的，一類是不合格的，所以我們可以創(chuàng)建兩個數(shù)據(jù)集類：

cls1_data =

2.9500 6.6300

2.5300 7.7900

3.5700 5.6500

3.1600 5.4700

cls2_data =

2.5800 4.4600

2.1600 6.2200

3.2700 3.5200

其中cls1_data為合格樣本，cls2_data為不合格的樣本，我們根據(jù)公式（1），（2）可以算出合格的樣本的期望值，不合格類樣本的合格的值，以及總樣本期望：

E_cls1 =

3.0525 6.3850

E_cls2 =

2.6700 4.7333

E_all =

2.8886 5.6771

我們可以做出現(xiàn)在各個樣本點的位置：

Clipboard Image.png

圖一

其中藍色‘*’的點代表不合格的樣本，而紅色實點代表合格的樣本，天藍色的倒三角是代表總期望，藍色三角形代表不合格樣本的期望，紅色三角形代表合格樣本的期望。從x，y軸的坐標方向上可以看出，合格和不合格樣本區(qū)分度不佳。

我們在可以根據(jù)表達式（3），（4）可以計算出類間離散度矩陣和類內(nèi)離散度矩陣：

Sb =

0.0358 0.1547

0.1547 0.6681

Sw =

0.5909 -1.3338

-1.3338 3.5596

我們可以根據(jù)公式（7），（8）算出特征值以及對應的特征向量：

L =

0.0000 0

0 2.8837

對角線上為特征值，第一個特征值太小被計算機約為0了

與他對應的特征向量為

V =

-0.9742 -0.9230

0.2256 -0.3848

根據(jù)取最大特征值對應的特征向量：（-0.9230,-0.3848)，該向量即為我們要求的子空間，我們可以把原來樣本投影到該向量后所得到新的空間（2維投影到1維，應該為一個數(shù)字）

new_cls1_data =

-5.2741

-5.3328

-5.4693

-5.0216

為合格樣本投影后的樣本值

new_cls2_data =

-4.0976

-4.3872

-4.3727

為不合格樣本投影后的樣本值，我們發(fā)現(xiàn)投影后，分類效果比較明顯，類和類之間聚合度很高，我們再次作圖以便更直觀看分類效果

Clipboard Image.png

圖二

藍色的線為特征值較小所對應的特征向量，天藍色的為特征值較大的特征向量，其中藍色的圈點為不合格樣本在該特征向量投影下來的位置，二紅色的‘*’符號的合格樣本投影后的數(shù)據(jù)集，從中個可以看出分類效果比較好（當然由于x，y軸單位的問題投影不那么直觀）。

我們再利用所得到的特征向量，來對其他樣本進行判斷看看它所屬的類型，我們?nèi)颖军c

（2.81，5.46），

我們把它投影到特征向量后得到：result = -4.6947 所以它應該屬于不合格樣本。

4.2 LDA算法與PCA算法

在傳統(tǒng)特征臉方法的基礎上，研究者注意到特征值打的特征向量（即特征臉）并一定是分類性能最好的方向，而且對K-L變換而言，外在因素帶來的圖像的差異和人臉本身帶來的差異是無法區(qū)分的，特征連在很大程度上反映了光照等的差異。研究表明，特征臉，特征臉方法隨著光線，角度和人臉尺寸等因素的引入，識別率急劇下降，因此特征臉方法用于人臉識別還存在理論的缺陷。線性判別式分析提取的特征向量集，強調(diào)的是不同人臉的差異而不是人臉表情、照明條件等條件的變化，從而有助于提高識別效果。

CDA數(shù)據(jù)分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

特征特征向量特征空間特征抽取 PCA 人工智能

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇圖論在大數(shù)據(jù)分析中的作用！

下一篇CDA認證再升一檔！與國家共同推進大數(shù)據(jù)人才培養(yǎng)標準教育事業(yè)！

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

線性判別分析(Linear Discriminant Analysis, LDA）算法分析

二． LDA假設以及符號說明：

三．公式推導，算法形式化描述

四．算法的物理意義和思考

4.1 用一個例子闡述LDA算法在空間上的意義

4.2 LDA算法與PCA算法

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

線性判別分析(Linear Discriminant Analysis, LDA）算法分析

二． LDA假設以及符號說明：

三． 公式推導，算法形式化描述

四． 算法的物理意義和思考

4.1 用一個例子闡述LDA算法在空間上的意義

4.2 LDA算法與PCA算法

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 ...

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè) ...

【CDA干貨】MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解 ...

【CDA干貨】解析 Python 中 Response 對象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 ...

【CDA干貨】Python HTTP 請求工具對比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長浮點數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu) ...

【CDA干貨】用 SQL 驗證業(yè)務邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營銷案例：數(shù)據(jù)驅(qū)動下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類分析：從操作實踐到業(yè)務 ...

【CDA干貨】統(tǒng)計模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

三．公式推導，算法形式化描述

四．算法的物理意義和思考

【CDA干貨】Excel 導入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗與 t 檢驗：差異、適用 ...