簡單易學的機器學習算法—線性支持向量機 一、線性支持向量機的概念 線性支持向量機是針對線性不可分的數據集的,這樣的數據集可以通過近似可分的方法實現(xiàn)分類。對于這樣的數據集,類似線性可分支持向量機 ...
2017-03-21簡單易學的機器學習算法—線性可分支持向量機 一、線性可分支持向量機的概念 線性可分支持向量機是用于求解線性可分問題的分類問題。對于給定的線性可分訓練數據集,通過間隔最大化構造相應的凸二次優(yōu)化問題可 ...
2017-03-21簡單易學的機器學習算法—支持向量機 支持向量機(Support Vector Machines, SVM)被公認為比較優(yōu)秀的分類模型,有很多人對SVM的基本原理做了闡述,我在學習的過程中也借鑒了他們的研究成果,在我介紹基本 ...
2017-03-20機器學習-回歸模型-欠擬合和過擬合 1. 什么是欠擬合和過擬合 先看三張圖片,這三張圖片是線性回歸模型 擬合的函數和訓練集的關系 第一張圖片擬合的函數和訓練集誤差較大,我們稱這種情況為欠擬合 第二 ...
2017-03-20模式識別、機器學習、數據挖掘當中的各種距離總結 在做分類時常常需要估算不同樣本之間的相似性度量(SimilarityMeasurement),這時通常采用的方法就是計算樣本間的“距離”(Distance)。采用什么樣的方法計算距 ...
2017-03-20用十張圖解釋機器學習的基本概念 在解釋機器學習的基本概念的時候,我發(fā)現(xiàn)自己總是回到有限的幾幅圖中。以下是我認為最有啟發(fā)性的條目列表。 1. Test and training error:為什么低訓練誤差并不總是一件 ...
2017-03-20從曲線擬合問題窺視機器學習中的相關概念 一直徘徊在機器學習的邊緣未敢輕易造次并畏懼其基本原理思想,從每一本厚厚的參考資料中都可以看出機器學習是一門跨越概率論、決策論、信息論以及最優(yōu)化的學科的綜合學 ...
2017-03-20在MATLAB中進行基于SVM的數據分析 MATLAB除了可以被用來進行信號處理之外,還可以用來完成一些數據挖掘任務。而說到數據挖掘,你腦海里一定會閃現(xiàn)過許多熟悉的算法,例如決策樹、樸素貝葉斯、邏輯回歸,以及支 ...
2017-03-20Python自然語言處理:詞干、詞形與MaxMatch算法 自然語言處理中一個很重要的操作就是所謂的stemming 和 lemmatization,二者非常類似。它們是詞形規(guī)范化的兩類重要方式,都能夠達到有效歸并詞形的目的,二者既 ...
2017-03-18在R中使用支持向量機(SVM)進行數據挖掘(下) 第二種使用svm()函數的方式則是根據所給的數據建立模型。這種方式形式要復雜一些,但是它允許我們以一種更加靈活的方式來構建模型。它的函數使用格式如下(注意 ...
2017-03-18在R中使用支持向量機(SVM)進行數據挖掘(上) 在R中,可以使用e1071軟件包所提供的各種函數來完成基于支持向量機的數據分析與挖掘任務。請在使用相關函數之前,安裝并正確引用e1071包。該包中最重要的一個函 ...
2017-03-18Python機器學習之Logistic回歸 大數據時代,數據猶如一座巨大的金礦,等待我們去發(fā)掘。而機器學習和數據挖掘的相關技術,無疑就是你挖礦探寶的必備利器!工欲善其事,必先利其器。很多初涉該領域的人,最先困惑 ...
2017-03-18牛頓法解機器學習中的Logistic回歸 這仍然是近期系列文章中的一篇。在這一個系列中,我打算把機器學習中的Logistic回歸從原理到應用詳細串起來。最初我們介紹了在Python中利用Scikit-Learn來建立Logistic回歸分 ...
2017-03-18從樸素貝葉斯分類器到貝葉斯網絡(下) 三、貝葉斯網絡 貝葉斯網絡(Bayesian Network)是一種用于表示變量間依賴關系的數據結構,有時它又被稱為信念網絡(Belief Network)或概率網絡(Probability Networ ...
2017-03-18從樸素貝葉斯分類器到貝葉斯網絡 一、貝葉斯公式(一些必備的數學基礎) 貝葉斯(Thomas Bayes)是生活在十八世紀的一名英國牧師和數學家。因為歷史久遠,加之他沒有太多的著述留存,今天的人們對貝葉斯的研 ...
2017-03-18機器學習中的隱馬爾科夫模型(HMM)詳解 在之前介紹貝葉斯網絡的博文中,我們已經討論過概率圖模型(PGM)的概念了。Russell等在文獻【1】中指出:“在統(tǒng)計學中,圖模型這個術語指包含貝葉斯網絡在內的比較寬泛 ...
2017-03-18機器學習中的Accuracy,Precision,Recall和F1-Score 在模式識別和信息檢索領域,二分類的問題(binary classification)是常會遇到的一類問題。例如,銀行的信用卡中心每天都會收到很多的信用卡申請,銀行必 ...
2017-03-18機器學習中的kNN算法及Matlab實例 K最近鄰(k-Nearest Neighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機器學習算法之一。該方法的思路是:如果一個樣本在特征空間中的k個最相似(即特征空 ...
2017-03-18機器學習中的EM算法詳解及R語言實例(2) 我們在上一篇文章中介紹了EM算法的基本原理,如果讀者對此不甚了解,建議參閱 機器學習中的EM算法詳解及R語言實例(1) 4. 高斯混合模型 高斯混合模型(GMM, ...
2017-03-18機器學習中的EM算法詳解及R語言實例(1) 最大期望算法(EM) K均值算法非常簡單,相信讀者都可以輕松地理解它。但下面將要介紹的EM算法就要困難許多了,它與極大似然估計密切相關。 1 算法原理 不妨 ...
2017-03-18CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-18剛入職場或是在職場正面臨崗位替代、技能更新、人機協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學習提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數據密不可分。網易公司創(chuàng)始人丁磊在《AI思維:從數據中創(chuàng)造價值的煉金術 ...
2025-07-18CDA 數據分析師:數據時代的價值挖掘者 在大數據席卷全球的今天,數據已成為企業(yè)核心競爭力的重要組成部分。從海量數據中提取有 ...
2025-07-18SPSS 賦值后數據不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數據分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現(xiàn)表數據同步操作指南? ? 在數據庫管理工作中,將一張表的數據同步到另一張表是常見需求,這有助于 ...
2025-07-18數據分析師的技能圖譜:從數據到價值的橋梁? 在數據驅動決策的時代,數據分析師如同 “數據翻譯官”,將冰冷的數字轉化為清晰的 ...
2025-07-17Pandas 寫入指定行數據:數據精細化管理的核心技能? 在數據處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數據集里精 ...
2025-07-17解碼 CDA:數據時代的通行證? 在數字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數據曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務數據分析:數據驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數字化轉型的浪潮中,“數據分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數據庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數據庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數據分析:驅動企業(yè)高效決策的核心引擎? 在數字經濟時代,企業(yè)面臨著前所未有的數據洪流,如何從海量數據中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數據整合的靈活之道? 在 MySQL 數據庫的日常操作中,我們經常會遇到需要整合多張表數據的場景 ...
2025-07-15Python Pandas:數據科學的瑞士軍刀? ? 在數據驅動的時代,面對海量、復雜的數據,如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數據分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數據科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11