公式:

1.?分類是指,根據(jù)一些給定的特征,對(duì)物品進(jìn)行分類,或?qū)π袨檫M(jìn)行預(yù)測(cè),即求上式的最大值。
2.?貝葉斯分類是一類分類算法的總稱,這類算法均以貝葉斯公式為基礎(chǔ),故統(tǒng)稱為貝葉斯分類。而樸素樸素貝葉斯分類是貝葉斯分類中最簡(jiǎn)單,也是常見的一種分類方法。
3.?樸素一詞的來源,是指假設(shè)各個(gè)特征之間相互獨(dú)立。
樸素貝葉斯的完整解釋如下:
假設(shè)某個(gè)體有n項(xiàng)特征(Feature),分別為F1、F2、...、Fn?,F(xiàn)有m個(gè)類別(Category),分別為C1、C2、...、Cm。貝葉斯分類器就是計(jì)算出概率最大的那個(gè)分類,也就是求下式的最大值:
P(C|F1F2...Fn) = P(F1F2...Fn|C)P(C) / P(F1F2...Fn)
由于?P(F1F2...Fn)?對(duì)于所有的類別都是相同的,可以省略,問題就變成了求下式的最大值:
P(F1F2...Fn|C)P(C)
樸素貝葉斯分類器則是更進(jìn)一步,假設(shè)所有特征都彼此獨(dú)立,因此變換成:
P(F1F2...Fn|C)P(C) = P(F1|C)P(F2|C) ... P(Fn|C)P(C)
上式等號(hào)右邊的每一項(xiàng),都可以從統(tǒng)計(jì)資料中得到,由此就可以計(jì)算出每個(gè)類別對(duì)應(yīng)的概率,從而找出最大概率的那個(gè)類。雖然"所有特征彼此獨(dú)立"這個(gè)假設(shè),在現(xiàn)實(shí)中不太可能成立,但是它可以大大簡(jiǎn)化計(jì)算,而且有研究表明對(duì)分類結(jié)果的準(zhǔn)確性影響不大。








暫無數(shù)據(jù)