【機器學習】半監(jiān)督學習幾種方法 1.Self-training algorithm(自訓練算法) 這個是最早提出的一種研究半監(jiān)督學習的算法,也是一種最簡單的半監(jiān)督學習算法. 2.Multi-view algorithm(多視角算法) 一般多 ...
2017-07-24機器學習模型評價(Evaluating Machine Learning Models)-主要概念與陷阱 本文主要解釋一些關于機器學習模型評價的主要概念,與評價中可能會遇到的一些陷阱。如訓練集-驗證集二劃分校驗(Hold-out validation) ...
2017-07-24Python的星號(*、**)的作用 1. 函數的可變參數 當函數的參數前面有一個星號*的時候表示這是一個可變的位置參數,兩個星號**表示是可變的關鍵字參數。 #!env python #coding=utf-8 # def foo(*args, **kwar ...
2017-07-24機器學習之Logistic回歸與Python實現 logistic回歸是一種廣義的線性回歸,通過構造回歸函數,利用機器學習來實現分類或者預測。 一 Logistic回歸概述 Logistic回歸的主要思想是,根據現有的數據對分類邊 ...
2017-07-24機器學習之樸素貝葉斯(NB)分類算法與Python實現 樸素貝葉斯(Naive Bayesian)是最為廣泛使用的分類方法,它以概率論為基礎,是基于貝葉斯定理和特征條件獨立假設的分類方法。 一、 概述 1.1 簡介 樸 ...
2017-07-23機器學習之決策樹(ID3)算法與Python實現 機器學習中,決策樹是一個預測模型;他代表的是對象屬性與對象值之間的一種映射關系。樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結 ...
2017-07-23數據挖掘的基本概念:數據庫、數據倉庫、機器學習,統(tǒng)計學 “數據挖掘“(Data Mining)又被稱為“數據中的知識發(fā)現”(KDD),顧名思義,也就是通過數據清理、數據集成、數據選擇、數據變換、數據挖掘、模式評估 ...
2017-07-23機器學習之k-近鄰(kNN)算法與Python實現 k-近鄰算法(kNN,k-NearestNeighbor),是最簡單的機器學習分類算法之一,其核心思想在于用距離目標最近的k個樣本數據的分類來代表目標的分類(這k個樣本數據和目標 ...
2017-07-23樣本統(tǒng)計量與總體的關系,抽樣分布的概念性質 本文對抽樣分布的概念、無偏差和最小偏差等性質,以及中心極限定理和樣本比例的抽樣分布進行總結。 1 抽樣分布基本概念 參數(parameter):參數是對總 ...
2017-07-23圖形和數值的數據集描述方法 圖形方法對數據集的描述 1. 條形圖(bar graph) 條形圖一般橫向表示類別(class),縱向表示該類別所對應的類別頻率(class frequency)。 2. 餅狀圖(pie graph) 餅狀圖 ...
2017-07-23掌握R語言中的apply函數族 剛開始接觸R語言時,會聽到各種的R語言使用技巧,其中最重要的一條就是不要用循環(huán),效率特別低,要用向量計算代替循環(huán)計算。 那么,這是為什么呢?原因在于R的循環(huán)操作for和while ...
2017-07-22R語言繪圖學習筆記 在做數據分析時,我們通常作的舉動就是畫散點圖分析。因為通過散點圖的分析,我們可以最直觀,最簡單的得出大概的結論。今天我分享的內容就是R語言的繪圖函數。 關于R語言強大的繪圖功能 ...
2017-07-22R語言基礎畫圖/繪圖/作圖 R語言基礎畫圖 R語言免費且開源,其強大和自由的畫圖功能,深受廣大學生和可視化工作人員喜愛,這篇文章對如何使用R語言作基本的圖形,如直方圖,點圖,餅狀圖以及箱線圖進行簡單介 ...
2017-07-22R語言與點估計學習筆記(EM算法與Bootstrap法) 一、EM算法 EM算法是一種在觀測到數據后,用迭代法估計未知參數的方法。可以證明EM算法得到的序列是穩(wěn)定單調遞增的。這種算法對于截尾數據或參數中有一些我們 ...
2017-07-22R語言與點估計學習筆記(矩估計與MLE) 眾所周知,R語言是個不錯的統(tǒng)計軟件。今天分享一下利用R語言做點估計的內容。主要有:矩估計、極大似然估計、EM算法、最小二乘估計、刀切法(Jackknife)、自助法(Boots ...
2017-07-22R語言與回歸分析幾個假設的檢驗 一、從線性回歸的假設說起 對于線性回歸而言,若要求回歸估計有一些良好性質比如無偏性,就需要加上一些假定條件。比如要達到估計的無偏性,我們通常需要加上高斯-馬爾科夫 ...
2017-07-22優(yōu)化與求解非線性方程組(單變量問題) 求函數極值的問題通常被化簡為求解導數為0的點的問題。所以優(yōu)化問題通常與解非線性方程組聯系起來。在前面寫點估計中的mle時,我們介紹了R中求解方程極值的函數nlm(), ...
2017-07-21多變量非線性方程求解問題(牛頓迭代法) 關于多變量的多元函數,我們求解考慮解的問題與單變量是極其類似的??紤]在x處的一階泰勒展開,我們有0=f(x0)=f(x)+j(x)(x-x0)(后面的等號近似成立,j表示jacobia ...
2017-07-21R語言與非參數統(tǒng)計(核密度估計) 核密度估計是在概率論中用來估計未知的密度函數,屬于非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。 假設我們有n ...
2017-07-21R語言與機器學習中的回歸方法學習筆記 機器學習中的一些方法如決策樹,隨機森林,SVM,神經網絡由于對數據沒有分布的假定等普通線性回歸模型的一些約束,預測效果也比較不錯,交叉驗證結果也能被接受。下面以R ...
2017-07-21在AI滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數據之戰(zhàn),CDA認證已成為決定企業(yè)存續(xù)的生死線!據麥肯錫全球研究院數據顯示,AI驅 ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無望、技能過時……當職場中年危機與數字化浪潮正面交鋒,你是否發(fā)現: 簡歷投了10 ...
2025-07-20CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-18剛入職場或是在職場正面臨崗位替代、技能更新、人機協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學習提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數據密不可分。網易公司創(chuàng)始人丁磊在《AI思維:從數據中創(chuàng)造價值的煉金術 ...
2025-07-18CDA 數據分析師:數據時代的價值挖掘者 在大數據席卷全球的今天,數據已成為企業(yè)核心競爭力的重要組成部分。從海量數據中提取有 ...
2025-07-18SPSS 賦值后數據不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數據分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現表數據同步操作指南? ? 在數據庫管理工作中,將一張表的數據同步到另一張表是常見需求,這有助于 ...
2025-07-18數據分析師的技能圖譜:從數據到價值的橋梁? 在數據驅動決策的時代,數據分析師如同 “數據翻譯官”,將冰冷的數字轉化為清晰的 ...
2025-07-17Pandas 寫入指定行數據:數據精細化管理的核心技能? 在數據處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數據集里精 ...
2025-07-17解碼 CDA:數據時代的通行證? 在數字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數據曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務數據分析:數據驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數字化轉型的浪潮中,“數據分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數據庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數據庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數據分析:驅動企業(yè)高效決策的核心引擎? 在數字經濟時代,企業(yè)面臨著前所未有的數據洪流,如何從海量數據中提取有 ...
2025-07-15MySQL 無外鍵關聯表的 JOIN 實戰(zhàn):數據整合的靈活之道? 在 MySQL 數據庫的日常操作中,我們經常會遇到需要整合多張表數據的場景 ...
2025-07-15Python Pandas:數據科學的瑞士軍刀? ? 在數據驅動的時代,面對海量、復雜的數據,如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14