感知機(jī)算法:
用一條線來(lái)做分類,線的上方屬于一類,下方屬于另一類
感知機(jī)的結(jié)果是通過(guò)一條線將測(cè)試集百分之百的分開(kāi)
對(duì)于非線性不可分的數(shù)據(jù)及來(lái)說(shuō),是找到一條高維的曲線來(lái)將類別分開(kāi)
是一種有監(jiān)督模型
超平面:
超平面就是
超平面在一維和二維空間下就是一條線
xgboost安裝:pip install xgboost -i https://pypi.tuna.tsinghua.edu.cn/simple
對(duì)于感知機(jī)來(lái)說(shuō)初始的參數(shù)值不一樣,最后的結(jié)果也不一樣,感知機(jī)的結(jié)果可能是無(wú)數(shù)個(gè)
只要數(shù)據(jù)集線性可分,就算有噪音點(diǎn),感知機(jī)肯定能找到超平面,算法一定能收斂
如果數(shù)據(jù)集線性不可分,那么感知機(jī)算法一直收斂不了,會(huì)一直跑下去,所以這種情況下不能用
如果想知道感知及是否線性可分,則每次必須畫圖,所以這個(gè)算法不是很好,但是其優(yōu)化算法svm很不錯(cuò)
對(duì)偶形式:
從單樣本的梯度下降衍生出來(lái)的結(jié)果,可以處理線性把不可分的問(wèn)題
在對(duì)偶形式中,離超平面越近的位置,被利用的次數(shù)越多,超平面有一大部分是由接近邊界的點(diǎn)決定的。這個(gè)結(jié)論和svm非常相似
對(duì)偶形式中的a值代表的是該樣本更新參數(shù)的次數(shù),對(duì)偶形式是一種無(wú)參數(shù)的模型
1. 越遠(yuǎn)的點(diǎn),超平面越能有確信度的將這些點(diǎn)分開(kāi),所以它們?cè)趩螛颖咎荻认陆诞?dāng)中,被更新的次數(shù)特別少,甚至不被更新
2. 離最終超平面越近的點(diǎn),這些點(diǎn)最難被分開(kāi),超平面最不確信能它們成功分開(kāi),所以需要更新很多次
3. 同個(gè)w和b的值可以看出,更新次數(shù)最多的那些點(diǎn),這些點(diǎn)的信息在w中占比是最大的
4. w和b的值最終決定了超平面的位置
5. 這些非??拷矫嫖恢玫狞c(diǎn),這些點(diǎn)的信息在w和b中占比最大
6. 暗示著這些點(diǎn)最終決定了超平面的位置
感知機(jī)缺點(diǎn):
如果是超平面是非線性的,那么模型不能收斂
受噪音點(diǎn)的影響很大,是一個(gè)過(guò)擬合的模型
沒(méi)有最優(yōu)的結(jié)果,有很多種解
拉格朗日乘子>=0








暫無(wú)數(shù)據(jù)