泛化能力,英文全稱(chēng)generalization ability,指機(jī)器學(xué)習(xí)算法對(duì)新鮮樣本的適應(yīng)能力,一種預(yù)測(cè)新的input類(lèi)別的能力。 通過(guò)學(xué)習(xí)找到隱含在數(shù)據(jù)背后的規(guī)律,并對(duì)具有同一規(guī)律的學(xué)習(xí)集以外的數(shù)據(jù),這種經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)可 ...
2020-05-21Bi這里是的意思就是Binary,二進(jìn)制的意思,所以有時(shí)候叫這個(gè)算法為二進(jìn)Kmeans算法。為什么我們需要用BiKmeans呢?就是為了解決初始化k個(gè)隨機(jī)的質(zhì)心點(diǎn)時(shí)其中一個(gè)或者多個(gè)點(diǎn)由于位置太極端而導(dǎo)致迭代的過(guò)程中消失的 ...
2020-05-21SVC,英文全稱(chēng)support vector machine,中文為支持向量機(jī),是一種分類(lèi)算法,但是也可以做回歸,根據(jù)輸入的數(shù)據(jù)不同可做不同的模型(若輸入標(biāo)簽為連續(xù)值則做回歸,若輸入標(biāo)簽為分類(lèi)值則用SVC()做分類(lèi)) ...
2020-05-20方法一: K平均算法(K-means聚類(lèi)分析) 在下面的誤差平方和圖中,拐點(diǎn)(bend or elbow)的位置對(duì)應(yīng)的x軸即k-means聚類(lèi)給出的合適的類(lèi)的個(gè)數(shù)。 > n = 100 > g=6 > set.seed(g) > d <- data.frame(x = unlist(lap ...
2020-05-20【磐創(chuàng)AI導(dǎo)讀】:評(píng)估一個(gè)模型是建立一個(gè)有效的機(jī)器學(xué)習(xí)模型的核心部分,本文為大家介紹了一些機(jī)器學(xué)習(xí)模型評(píng)估指標(biāo),希望對(duì)大家有所幫助。 評(píng)估一個(gè)模型是建立一個(gè)有效的機(jī)器學(xué)習(xí)模型的核心部分 ...
2020-05-20最大后驗(yàn)估計(jì)(maximum a posteriori probability estimate, 簡(jiǎn)稱(chēng)MAP),是貝葉斯學(xué)派的法寶之一。 與統(tǒng)計(jì)學(xué)派不同,貝葉斯學(xué)派認(rèn)為在做估計(jì)之前,人們對(duì)要估計(jì)的實(shí)物先有一個(gè)經(jīng)驗(yàn)性的判斷,然后根據(jù)數(shù)據(jù)調(diào)整對(duì)這 ...
2020-05-20特征向量(eigenvector),矩陣?yán)碚撋弦粋€(gè)非常重要的概念,被廣泛的應(yīng)用于各個(gè)領(lǐng)域。 數(shù)學(xué)上,線性變換的特征向量(本征向量)是一個(gè)非簡(jiǎn)并的向量,其方向在該變換下不變,該向量在此變換下縮放的比例稱(chēng)為其特征值 ...
2020-05-201.AI人工智能 Artificial Intelligence 人工智能(Artificial Intelligence),英文縮寫(xiě)為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。 人工智 ...
2020-05-20Z-Score,又稱(chēng)為再Z分?jǐn)?shù)、標(biāo)準(zhǔn)分?jǐn)?shù),一個(gè)數(shù)與平均數(shù)的差再除以標(biāo)準(zhǔn)差的過(guò)程。 Z-Score能夠衡量出一個(gè)分?jǐn)?shù)距離平均數(shù)的相對(duì)標(biāo)準(zhǔn)距離,如果我們把每一個(gè)分?jǐn)?shù)都轉(zhuǎn)換成z分?jǐn)?shù),那么每一個(gè)z分?jǐn)?shù)會(huì)以標(biāo)準(zhǔn)差為單位表示 ...
2020-05-20召回率(Recall),一般指查全率,指從數(shù)據(jù)庫(kù)內(nèi)檢出的相關(guān)的信息量與總量的比率,是數(shù)據(jù)挖掘中預(yù)測(cè)、互聯(lián)網(wǎng)中的搜索引擎等經(jīng)常涉及的兩個(gè)概念和指標(biāo)之一。 在實(shí)際應(yīng)用中,多數(shù)人更喜歡稱(chēng)召回率為召回率,因?yàn)楦荏w ...
2020-05-20先驗(yàn)概率和后驗(yàn)概率是與貝葉斯概率更新有關(guān)的兩個(gè)概念百。假如某一不確定事件發(fā)生的主觀概率 因?yàn)槟硞€(gè)新情況的出現(xiàn) 而發(fā)生了改變,那么改變前的那個(gè)概率就被叫做先驗(yàn)概率,改變后的概率就叫后驗(yàn)概率。 先驗(yàn)概率是指 ...
2020-05-19K-s是模型驗(yàn)證的最常用的“武器”之一,而K-s曲線指洛倫茲曲線之間的差值。 K-S曲線主要是驗(yàn)證模型的區(qū)分能力,通常是在模型預(yù)測(cè)全體樣本的信用評(píng)分后,將全體樣本按違約與非違約分為兩部分,然后用K-S統(tǒng)計(jì)量來(lái)檢驗(yàn) ...
2020-05-19在判斷是有監(jiān)督學(xué)習(xí)還是在無(wú)監(jiān)督學(xué)習(xí)上,我們可以具體是否有監(jiān)督(supervised),就看輸入數(shù)據(jù)是否有標(biāo)簽(label)。輸入數(shù)據(jù)有標(biāo)簽,則為有監(jiān)督學(xué)習(xí),沒(méi)標(biāo)簽則為無(wú)監(jiān)督學(xué)習(xí)。 什么是學(xué)習(xí)(learning)? 一個(gè)成語(yǔ) ...
2020-05-19有部分同學(xué),在學(xué)習(xí)初期,會(huì)認(rèn)為下采樣和池化是指同樣的事情,只是叫法不同而已,其實(shí)這是一種錯(cuò)誤的認(rèn)知。 下采樣(subsampled),或稱(chēng)為降采樣(downsampled),指縮小圖像。其主要目是使得圖像符合顯示區(qū)域的 ...
2020-05-19FP-Growth使用了一種特殊的分治策略,將提供頻繁項(xiàng)集的數(shù)據(jù)庫(kù)壓縮到一棵頻繁模式樹(shù)(FP-tree),但仍保留項(xiàng)集關(guān)聯(lián)信息。 這種關(guān)聯(lián)分析算法的概念由韓嘉煒等人在2000年提出,在FP-Growth算法中使用了一種稱(chēng)為頻繁模 ...
2020-05-19feature importance指特征重要性,在特征選擇的許多方法中,我們可以使用隨機(jī)森林模型中的特征重要屬性來(lái)篩選特征,并得到其與分類(lèi)的相關(guān)性。 由于隨機(jī)森林存在的固有隨機(jī)性,該模型可能每次給予特征不同的重要性 ...
2020-05-19人工智能涉及到很多的技術(shù),大家都知道人工智能離不開(kāi)機(jī)器學(xué)習(xí),不過(guò)比較少人知道人工智能也是離不開(kāi)模式識(shí)別的。什么是模式識(shí)別呢?簡(jiǎn)單點(diǎn)說(shuō),模式識(shí)別就是對(duì)各種情況的識(shí)別。而在人工智能中,模式識(shí)別是一 ...
2020-05-19機(jī)器學(xué)習(xí)算法會(huì)涉及到大量的數(shù)學(xué)基礎(chǔ)內(nèi)容,數(shù)學(xué)好的童靴們,你們的優(yōu)勢(shì)來(lái)了。在機(jī)器學(xué)習(xí)中涉及到了三個(gè)數(shù)學(xué)工具,分別是線性代數(shù)、概率統(tǒng)計(jì)(概率估計(jì))、最優(yōu)化理論。 今天,我們來(lái)講概率統(tǒng)計(jì),在機(jī)器學(xué)習(xí)中會(huì)涉及 ...
2020-05-19在統(tǒng)計(jì)學(xué)中,連續(xù)型變量和離散型變量極為常見(jiàn),今天我們就來(lái)看看它們的區(qū)別是什么? 變量值的變動(dòng)幅度不同。 對(duì)離散變量,如果變量值的變動(dòng)幅度小,就可以一個(gè)變量值對(duì)應(yīng)一組,稱(chēng)單項(xiàng)式分組。如居民家庭按兒童數(shù)或 ...
2020-05-18一般來(lái)說(shuō),Rcall指令屬于ROM空間的相對(duì)尋址范疇,call屬于ROM空間的直接尋址范疇。 CALL和RCALL的區(qū)別: 1、指令長(zhǎng)度不同; 2、指令執(zhí)行所需機(jī)器周期不同; 3、尋址范圍不同。 ——其他知識(shí)點(diǎn)普及: R ...
2020-05-18訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11