K-means算法原理與R語言實(shí)例 聚類是將相似對象歸到同一個簇中的方法,這有點(diǎn)像全自動分類。簇內(nèi)的對象越相似,聚類的效果越好。支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)所討論的分類問題都是有監(jiān)督的學(xué)習(xí)方式,現(xiàn)在我們所介紹的聚 ...
2017-03-17數(shù)據(jù)挖掘十大算法之Apriori詳解 有時候,人們會對機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘這兩個名詞感到困惑。如果你翻開一本冠以機(jī)器學(xué)習(xí)之名的教科書,再同時翻開一本名叫數(shù)據(jù)挖掘的教材,你會發(fā)現(xiàn)二者之間有相當(dāng)多重合的內(nèi)容。 ...
2017-03-17python中pyc和pyo的作用 pyc文件,是Python編譯后的字節(jié)碼(bytecode)文件。只要你運(yùn)行了py文件,python編譯器就會自動生成一個對應(yīng)的pyc字節(jié)碼文件。這個pyc字節(jié)碼文件,經(jīng)過python解釋器,會生成機(jī)器碼運(yùn)行 ...
2017-03-17Python變量作用域 1、作用域介紹 python中的作用域分4種情況: L:local,局部作用域,即函數(shù)中定義的變量; E:enclosing,嵌套的父級函數(shù)的局部作用域,即包含此函數(shù)的上級函數(shù)的局部作用域,但不是全局的; ...
2017-03-17數(shù)據(jù)挖掘十大算法之決策樹詳解(2) ID3算法 ID3和C4.5都是由澳大利亞計(jì)算機(jī)科學(xué)家Ross Quinlan開發(fā)的決策樹構(gòu)建算法,其中C4.5是在ID3上發(fā)展而來的。 ID3算法的核心是在決策樹各個結(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn) ...
2017-03-17數(shù)據(jù)挖掘十大算法之決策樹詳解(1) 從分類問題開始 分類(Classification)任務(wù)就是確定對象屬于哪個預(yù)定義的目標(biāo)類。分類問題不僅是一個普遍存在的問題,而且是其他更加復(fù)雜的決策問題的基礎(chǔ),更是機(jī)器學(xué)習(xí) ...
2017-03-17數(shù)據(jù)挖掘十大算法之CART詳解 CART生成 CART假設(shè)決策樹是二叉樹,內(nèi)部結(jié)點(diǎn)特征的取值為“是”和“否”,左分支是取值為“是”的分支,右分支是取值為“否”的分支。這樣的決策樹等價(jià)于遞歸地二分每個特征,將 ...
2017-03-16機(jī)器學(xué)習(xí)優(yōu)化算法之爬山算法小結(jié) 機(jī)器學(xué)習(xí)的項(xiàng)目,不可避免的需要補(bǔ)充一些優(yōu)化算法,對于優(yōu)化算法,爬山算法還是比較重要的.鑒于此,花了些時間仔細(xì)閱讀了些爬山算法的paper.基于這些,做一些總結(jié). 目錄 1. 爬山 ...
2017-03-16Python學(xué)習(xí)-函數(shù)、作用域 函數(shù): 定義函數(shù): >>> def do_nothing() pass 調(diào)用函數(shù): >>> do_nothing() None:是Python中的一個特殊的值,它和False,空值是有區(qū)別的。 注意函數(shù)參數(shù)的傳入 ...
2017-03-16Python學(xué)習(xí)-語句、語法 #: 注釋,不支持多行注釋 \\: 連接,當(dāng)一行的程序太長時,可以使用連接符\\(反斜杠) 1、使用if、elif和 else進(jìn)行標(biāo)記 小于兩個的選擇: if 條件 : 語句段1 else : ...
2017-03-16機(jī)器學(xué)習(xí)-Cross Validation交叉驗(yàn)證Python實(shí)現(xiàn) 1.原理 1.1 概念 交叉驗(yàn)證(cross-validation)主要用于模型訓(xùn)練或建模應(yīng)用中,如分類預(yù)測、pcr、pls回歸建模等。在給定的樣本空間中,拿出大部分樣本作為訓(xùn)練集來 ...
2017-03-16機(jī)器學(xué)習(xí)中概率論知識復(fù)習(xí) 1 基本概念 概率論在機(jī)器學(xué)習(xí)中扮演著一個核心角色,因?yàn)闄C(jī)器學(xué)習(xí)算法的設(shè)計(jì)通常依賴于對數(shù)據(jù)的概率假設(shè)。 1.1 概率空間 說到概率,通常是指一個具有不確定性的event發(fā)生的 ...
2017-03-16機(jī)器學(xué)習(xí)實(shí)現(xiàn)與分析之五(高斯判別分析) 高斯判別分析(GDA)簡介 首先,高斯判別分析的作用也是用于分類。對于兩類樣本,其服從伯努利分布,而對每個類中的樣本,假定都服從高斯分布,則有: 這 ...
2017-03-15機(jī)器學(xué)習(xí)實(shí)現(xiàn)與分析之四(廣義線性模型) 指數(shù)分布族 首先需要提及下指數(shù)分布族,它是指一系列的分布,只要其概率密度函數(shù)可以寫成下面這樣的形式: 一般的很多分布(如高斯分布,泊松分布,二項(xiàng) ...
2017-03-15斯坦福機(jī)器學(xué)習(xí)實(shí)現(xiàn)與分析之二(線性回歸) 回歸問題提出 首先需要明確回歸問題的根本目的在于預(yù)測。對于某個問題,一般我們不可能測量出每一種情況(工作量太大),故多是測量一組數(shù)據(jù),基于此數(shù)據(jù)去預(yù) ...
2017-03-15梯度下降法分析 梯度下降法的基本思想是函數(shù)沿著其梯度方向增加最快,反之,沿著其梯度反方向減小最快。在前面的線性回歸和邏輯回歸中,都采用了梯度下降法來求解。梯度下降的迭代公式為: \\(\\begin{aligned} ...
2017-03-15批量梯度下降與隨機(jī)梯度下降 下面的h(x)是要擬合的函數(shù),J(theta)損失函數(shù),theta是參數(shù),要迭代求解的值,theta求解出來了那最終要擬合的函數(shù)h(theta)就出來了。其中m是訓(xùn)練集的記錄條數(shù),j是參數(shù)的個數(shù)。 ...
2017-03-15從導(dǎo)數(shù)的物理意義理解梯度下降 機(jī)器學(xué)習(xí)中常會用隨機(jī)梯度下降法求解一個目標(biāo)函數(shù)L(Θ)的優(yōu)化問題,并且常是最小化的一個優(yōu)化問題: minL(Θ) 我們所追求的是目標(biāo)函數(shù)能夠快速收斂或到達(dá)一個極小值點(diǎn)。而隨機(jī)梯 ...
2017-03-155個開源Python庫,點(diǎn)亮你的機(jī)器學(xué)習(xí)之路 機(jī)器學(xué)習(xí)令人興奮,但實(shí)際操作卻很困難也很復(fù)雜。它涉及到很多手動提升,如集合工作流,設(shè)置數(shù)據(jù)源,以及在內(nèi)部部署與云部署的資源之間切換等。 Python 是一款強(qiáng)大的 ...
2017-03-14機(jī)器學(xué)習(xí)常用算法(LDA,CNN,LR)原理簡述 1.LDA LDA是一種三層貝葉斯模型,三層分別為:文檔層、主題層和詞層。該模型基于如下假設(shè): 1)整個文檔集合中存在k個互相獨(dú)立的主題; 2)每一個主題是詞上的多項(xiàng) ...
2017-03-14CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘龌蚴窃诼殘稣媾R崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競爭力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時用t.test,何時用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11