問:
sklearn的主要設(shè)計(jì)原則是什么
答:
主要的設(shè)計(jì)原則如下:
?致性:所有對(duì)象共享?個(gè)簡(jiǎn)單?致的界?(接?)。
估算器: fit()?法?;跀?shù)據(jù)估算參數(shù)的任意對(duì)象,使?的參數(shù)是?個(gè)數(shù)據(jù)集(對(duì)應(yīng)X, 有監(jiān)督算法還需要?個(gè)y),引導(dǎo)估算過程的任意其他參數(shù)稱為超參數(shù),必須被設(shè)置為實(shí)例變量。
轉(zhuǎn)換器: transform()?法。使?估算器轉(zhuǎn)換數(shù)據(jù)集,轉(zhuǎn)換過程依賴于學(xué)習(xí)參數(shù)??梢?使?便捷?式: fit_transform(),相當(dāng)于先fit()再transform()。 (fit_transform有時(shí)被優(yōu)化過,速度更快)
預(yù)測(cè)器: predict()?法。使?估算器預(yù)測(cè)新數(shù)據(jù),返回包含預(yù)測(cè)結(jié)果的數(shù)據(jù),還有 score()?法:?于度量給定測(cè)試集的預(yù)測(cè)效果的好壞。 (連續(xù)y使?R?,分類y使?準(zhǔn)確率accuracy)
監(jiān)控:檢查所有參數(shù),所有估算器的超參數(shù)可以通過公共實(shí)例變量訪問,所有估算器的學(xué)習(xí)參數(shù)都
可以通過有下劃線后綴的公共實(shí)例變量訪問。
防?類擴(kuò)散:對(duì)象類型固定,數(shù)據(jù)集被表示為Numpy數(shù)組或Scipy稀疏矩陣,超參是普通的
Python字符或數(shù)字 。
合成:現(xiàn)有的構(gòu)件盡可能重?,可以輕松創(chuàng)建?個(gè)流?線Pipeline。
合理默認(rèn)值:?多數(shù)參數(shù)提供合理默認(rèn)值,可以輕松搭建?個(gè)基本的?作系統(tǒng)。
Scikit-learn重視機(jī)器學(xué)習(xí)的邏輯性和系統(tǒng)性,所以有選擇的忽略了某些算法中偏統(tǒng)計(jì)? ?的邏輯和結(jié)果,
例如回歸








暫無數(shù)據(jù)