求問PSS-CHAID決策樹結(jié)果如何解讀,然后如何根據(jù)結(jié)果計(jì)算分組后的變異系數(shù)、中位數(shù)等等
梁程晴
2020-12-18
在python開發(fā)中,經(jīng)常需要使用到各種各樣的庫。pip又是我們常用的安裝工具。但是國外的源下載速度實(shí)在太慢,經(jīng)常導(dǎo)致超時(shí)。對(duì)于這種情況我們可以修改pip的下載源為國內(nèi)源。這樣就可以大幅度提升下載速度。推薦幾個(gè)不錯(cuò)的國內(nèi)鏡像:阿里云:https://mirrors.aliyun.com/pypi/simple/豆瓣:https://pypi.douban.com/simple/清華大學(xué):https
梁程晴
2020-09-20
softmax函數(shù),又稱歸一化指數(shù)函數(shù)。它是二分類函數(shù)sigmoid在多分類上的推廣,目的是將多分類的結(jié)果以概率的形式展現(xiàn)出來。下圖展示了softmax的計(jì)算方法:下面為大家解釋一下為什么softmax是這種形式。首先,我們知道概率有兩個(gè)性質(zhì):1)預(yù)測的概率為非負(fù)數(shù);2)各種預(yù)測結(jié)果概率之和等于1。softmax就是將在負(fù)無窮到正無窮上的預(yù)測結(jié)果按照這兩步轉(zhuǎn)換為概率的。1)將預(yù)測結(jié)果轉(zhuǎn)化為非負(fù)數(shù)下
梁程晴
2020-09-09
圖像分類任務(wù)上,訓(xùn)練數(shù)據(jù)不足帶來的問題主要表現(xiàn)在過擬合方面,即模型在訓(xùn)練樣本上的效果可能不錯(cuò),但在測試集上的泛化效果不佳。處理方法大致也可以分兩類,一是基于模型的方法,主要是采用降低過擬合風(fēng)險(xiǎn)的措施, 包括簡化模型(如將非線性模型簡化為線性模型)、添加約束項(xiàng)以縮小假設(shè)空間(如L1/L2正則項(xiàng))、集成學(xué)習(xí)、Dropout超參數(shù)等;二是基于數(shù)據(jù)的方法,主要通過數(shù)據(jù)擴(kuò)充(Data Augmentatio
梁程晴
2020-09-08
降維的原因1、 解決維度災(zāi)難問題2、 減小運(yùn)算量,減少數(shù)據(jù)存儲(chǔ)空間3、 降低模型復(fù)雜度,降低過擬合風(fēng)險(xiǎn)4、 方便理解,方便可視化常用的降維方法PCA(無監(jiān)督,讓映射后的樣本具有最大的發(fā)散性)LDA(有監(jiān)督,讓映射后的樣本有最好的分類性能)
梁程晴
2020-09-08
LR(邏輯回歸)是loss最優(yōu)化(似然函數(shù)最大)出的,NB(樸素貝葉斯)是跳過統(tǒng)計(jì)Loss最優(yōu),直接得出權(quán)重的NB比LR多了一個(gè)各個(gè)特征獨(dú)立假設(shè),輸入特征是連續(xù),服從高斯分布。LR屬于判別模型,NB是生成模型
梁程晴
2020-09-07
Iris數(shù)據(jù)集是常用的分類實(shí)驗(yàn)數(shù)據(jù)集,由Fisher, 1936收集整理。Iris也稱鳶尾花卉數(shù)據(jù)集,是一類多重變量分析的數(shù)據(jù)集。數(shù)據(jù)集包含150個(gè)數(shù)據(jù)樣本,分為3類,每類50個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)包含4個(gè)屬性??赏ㄟ^花萼長度,花萼寬度,花瓣長度,花瓣寬度4個(gè)屬性預(yù)測鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個(gè)種類中的哪一類。iris以鳶尾花的特征作為數(shù)據(jù)來源,常用在分類
梁程晴
2020-08-25
附:支持向量機(jī):https://blog.csdn.net/b285795298/article/details/81977271(CSDN轉(zhuǎn)載)
梁程晴
2020-08-23
對(duì)角線法則(僅適用于二階、三階,四階及以上的不適用)計(jì)算通式法 3.利用行列式的性質(zhì)進(jìn)行計(jì)算 4.按行(列)展開式(降維) 5.使用EXCEL中的MDETERM函數(shù)
梁程晴
2020-07-29
性質(zhì)1 行列式與它的轉(zhuǎn)置行列式相等。性質(zhì)2 互換行列式的兩行( 列 ),行列式變號(hào)。推論:若行列式有兩行(列)相同,則行列式為0。性質(zhì)3 用非零數(shù) k 乘行列式的某一行(列)中所有元素, 等于用數(shù)k 乘此行列式。推論:行列式中某一行(列)的公因子可以提到行列式符號(hào)外面。性質(zhì)4 若行列式有兩行(列)的對(duì)應(yīng)元素成比例,則行 列式等于0 。性質(zhì)5 若某一行是兩組數(shù)的和,則此行列式就等 于如下兩個(gè)行列式
梁程晴
2020-07-29
電商黃金公式: 銷售額 = 流量 * 轉(zhuǎn)化率 * 客單價(jià)流量數(shù)量重要指標(biāo):? 訪客數(shù)(UV):到達(dá)店鋪頁面的非重復(fù)用戶數(shù)? 瀏覽量(PV):店鋪內(nèi)瀏覽和查看頁面的累加次數(shù)? 訪問次數(shù)(Visits):一個(gè)會(huì)話內(nèi)被用戶連續(xù)訪問的次數(shù) ? 新訪客數(shù): 新進(jìn)訪客數(shù)流量質(zhì)量重要指標(biāo): ? 平均訪問深度:瀏覽量 / 訪問次數(shù) ? 跳失率:跳出次數(shù) / 訪問次數(shù) ? 新訪客占比: 新訪客數(shù) / 訪客數(shù)流量轉(zhuǎn)化
梁程晴
2020-07-16
連接規(guī)則說明圖T1:無論篩選方向?yàn)閱蜗蜻€是雙向,路徑通的情況下,一表出維度,多表出度量,均為類型一。T2:篩選方向?yàn)閱蜗驎r(shí),多表出維度,一表出度量無法正確匯總值規(guī)則(×);篩選方向?yàn)殡p向時(shí),為類型二;跨表篩選路徑通也為類型二。多對(duì)一篩選規(guī)則:T1:維度對(duì)度量進(jìn)行合并同類項(xiàng)的計(jì)算T2:維度下對(duì)應(yīng)的連接用關(guān)鍵字段不同情況對(duì)度量進(jìn)行匯總總結(jié):1.雙向連接可以跨表取字段2.一對(duì)一的關(guān)系下使用默認(rèn)雙向連接,
梁程晴
2020-07-16
單表查詢?nèi)聿樵儯簊elect * from 表名;查詢指定列:select 字段1[,字段2,…] from 表名;別名的設(shè)置:select 字段名[ as] 列別名 from 原表名 [as ]表別名;查詢不重復(fù)的記錄:select distinct 字段名 from 表名;條件查詢:select 字段1[,字段2,…] from 表名 where 查詢條件;空值查詢:select 字段1[,
梁程晴
2020-07-11
數(shù)據(jù)庫定義語言DDL數(shù)據(jù)庫的增刪選查 查:show databases; 創(chuàng)建:create database 數(shù)據(jù)庫名稱; 選擇使用:use 數(shù)據(jù)庫名稱;數(shù)據(jù)表的增刪改查 創(chuàng)建:create table 表名 (字段名 類型); 查看表:show tables; 查看表結(jié)構(gòu):desc 表名;常用約束條件
梁程晴
2020-07-06
今日課堂兩種數(shù)據(jù)導(dǎo)入方式分享MySQL8.0導(dǎo)入數(shù)據(jù)https://blog.csdn.net/kejiayuan0806/article/details/103170790
梁程晴
2020-07-06