R語言多元分析系列 R語言多元分析系列之一:主成分分析 主成分分析(principal components analysis, PCA)是一種分析、簡(jiǎn)化數(shù)據(jù)集的技術(shù)。它把原始數(shù)據(jù)變換到一個(gè)新的坐標(biāo)系統(tǒng)中,使得任何數(shù)據(jù)投影的第一 ...
2017-07-21R語言的常用函數(shù)速查 基本 一、數(shù)據(jù)管理 vector:向量 numeric:數(shù)值型向量 logical:邏輯型向量character;字符型向量 list:列表 data.frame:數(shù)據(jù)框c:連接為向量或列表 length:求長(zhǎng)度 subset:求子集 ...
2017-07-21R語言與抽樣技術(shù)學(xué)習(xí)筆記(Jackknife) R語言與抽樣技術(shù)學(xué)習(xí)筆記(Randomize,Jackknife,bootstrap) Jackknife算法 Jackknife的想法在我很早的一篇博客《R語言與點(diǎn)估計(jì)學(xué)習(xí)筆記(刀切法與最小二乘估計(jì) ...
2017-07-20R語言與抽樣技術(shù)學(xué)習(xí)筆記(bootstrap) Bootstrap方法 Bootstrap一詞來源于西方神話故事“The adventures of Baron Munchausen”歸結(jié)出的短語“to pull oneself up by one\'s bootstrap\",意味著不靠外界力 ...
2017-07-20R語言與函數(shù)估計(jì)學(xué)習(xí)筆記(函數(shù)展開) 函數(shù)估計(jì) 說到函數(shù)的估計(jì)我們可以肯定的一點(diǎn)是我們很難得到原模型的函數(shù),不過我們可以找到一個(gè)不壞的函數(shù)去逼近它,所以我們的函數(shù)估計(jì)從函數(shù)展開開始說起。 函數(shù) ...
2017-07-20R語言與函數(shù)估計(jì)學(xué)習(xí)筆記(核方法與局部多項(xiàng)式) 非參數(shù)方法 用于函數(shù)估計(jì)的非參數(shù)方法大致上有三種:核方法、局部多項(xiàng)式方法、樣條方法。 非參的函數(shù)估計(jì)的優(yōu)點(diǎn)在于穩(wěn)健,對(duì)模型沒有什么特定的假設(shè),只是認(rèn) ...
2017-07-20R語言與函數(shù)估計(jì)學(xué)習(xí)筆記(樣條方法) 樣條估計(jì) 如果函數(shù)在不同地方有不同的非線性度,或者有多個(gè)極值點(diǎn),那么用多項(xiàng)式特別是低階多項(xiàng)式來完成擬合是非常不合適的。一種解決辦法是我們之前提到的近鄰多項(xiàng)式 ...
2017-07-20R語言與點(diǎn)估計(jì)學(xué)習(xí)筆記(刀切法與最小二乘估計(jì)) 一、刀切法(jackknife) 刀切法的提出,是基于點(diǎn)估計(jì)準(zhǔn)則無偏性。刀切法的作用就是不斷地壓縮偏差。但需要指出的是縮小偏差并不是一個(gè)好的辦 ...
2017-07-20R語言與簡(jiǎn)單的回歸分析 回歸模型是計(jì)量里最基礎(chǔ)也最常見的模型之一。究其原因,我想是因?yàn)樵趯?shí)際問題中我們并不知道總體分布如何,而且只有一組數(shù)據(jù),那么試著對(duì)數(shù)據(jù)作回歸分析將會(huì)是一個(gè)不錯(cuò)的選擇。 一、 ...
2017-07-19R語言與顯著性檢驗(yàn)學(xué)習(xí)筆記 一、何為顯著性檢驗(yàn) 顯著性檢驗(yàn)的思想十分的簡(jiǎn)單,就是認(rèn)為小概率事件不可能發(fā)生。雖然概率論中我們一直強(qiáng)調(diào)小概率事件必然發(fā)生,但顯著性檢驗(yàn)還是相信了小概率事件在我做的這一 ...
2017-07-19R語言之各種檢驗(yàn) 1、W檢驗(yàn)(Shapiro–Wilk (夏皮羅–威克爾 ) W統(tǒng)計(jì)量檢驗(yàn)) 檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,R函數(shù):shapiro.test(). 結(jié)果含義:當(dāng)p值小于某個(gè)顯著性水平α(比如0.05)時(shí),則認(rèn)為 ...
2017-07-19R語言t檢驗(yàn) I.單樣本t檢驗(yàn) 例1. 有原始數(shù)據(jù)的t檢驗(yàn) 已知某水樣中含碳酸鈣的真值為20.7mg/L,現(xiàn)用某法重復(fù)測(cè)定該水樣12次,碳酸鈣的含量分別為..問該法測(cè)定碳酸鈣含量所得的均值與診治有無顯著差異? x ...
2017-07-19R語言邏輯回歸、ROC曲線和十折交叉驗(yàn)證 自己整理編寫的邏輯回歸模板,作為學(xué)習(xí)筆記記錄分享。數(shù)據(jù)集用的是14個(gè)自變量Xi,一個(gè)因變量Y的australian數(shù)據(jù)集。 1. 測(cè)試集和訓(xùn)練集3、7分組 [html] view plain copy ...
2017-07-19R語言判別分析 本文中分三個(gè)方法介紹判別分析,Bayes判別,距離判別,F(xiàn)isher判別。前兩種判別方法都要考慮兩個(gè)、或多個(gè)總體協(xié)方差(這里是算方差,方差是協(xié)方差的一種)相等或不等的情況,由var.equal=的邏輯參 ...
2017-07-19SAS邏輯回歸之二分類 數(shù)據(jù)集這里用的是australian,有14個(gè)自變量Xi,一個(gè)因變量Y,Y值只取0或1。 代碼如下: /*邏輯回歸數(shù)據(jù)集australian(690個(gè)觀測(cè)值,每個(gè)含14個(gè)屬性,目標(biāo)變量y(0、1))*/ /*導(dǎo)入 ...
2017-07-18R語言關(guān)聯(lián)規(guī)則 # Apriori算法實(shí)現(xiàn)關(guān)聯(lián)規(guī)則挖掘 #======================= MODEL1. 輸入數(shù)據(jù)集為transaction類型 ====================== #install.packages(\"arules\") #Apriori算法程序包 lib ...
2017-07-18R語言主成分分析 解決自變量之間的多重共線性和減少變量個(gè)數(shù) 根據(jù)主成分分析的原理,它一方面可以將k個(gè)不獨(dú)立的指標(biāo)變量通過線性變換變成k個(gè)相互獨(dú)立的新變量,這是解決多重共線性問題的一個(gè)重要方法;另一 ...
2017-07-18R語言典型相關(guān)分析 1 關(guān)鍵點(diǎn):典型相關(guān)分析 典型相關(guān)分析是用于分析兩組隨機(jī)變量之間的相關(guān)程度的一種統(tǒng)計(jì)方法,它能夠有效地揭示兩組隨機(jī)變量之間的相互(線性依賴)關(guān)系 例如 研究生入學(xué)考試成績(jī)與本科 ...
2017-07-18R語言因子分析 因子模型: X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T為公共因子向量,[ε=(ε1,ε2,…,εp)]^T為特殊因子向量,A=[(aij)]^(p×m)為因子載荷矩陣。 I.參數(shù)估計(jì) 為了建立因子模型,需要要 ...
2017-07-18R語言方差分析ANOVA 自己整理編寫的R語言常用數(shù)據(jù)分析模型的模板,原文件為Rmd格式,直接復(fù)制粘貼過來,作為個(gè)人學(xué)習(xí)筆記保存和分享。 I. 單因素方差分析 #用data frame的格式輸入數(shù)據(jù) medicine <- data.frame( ...
2017-07-18CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11