sas字符變量基于iv值的最優(yōu)分類 1.IV的用途 IV的全稱是InformationValue,中文意思是信息價(jià)值,或者信息量。 我們?cè)谟眠壿嫽貧w、決策樹等模型方法構(gòu)建分類模型時(shí),經(jīng)常需要對(duì)自變量進(jìn)行篩選。比如我們有2 ...
2017-03-27SAS中最常用的10個(gè)命令 SAS是喬伊平時(shí)學(xué)習(xí)中常用到的數(shù)據(jù)處理軟件之一。在處理大批量數(shù)據(jù)時(shí),SAS不能說太好用呢。SAS也是學(xué)習(xí)起來十分簡(jiǎn)單的一個(gè)軟件,掌握一些基本的命令,就可以滿足日常的數(shù)據(jù)處理需求。 ...
2017-03-27簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—Gibbs采樣 一、Gibbs采樣概述 前面介紹的Metropolis-Hastings采樣為從指定分布中進(jìn)行采樣提供了一個(gè)統(tǒng)一的框架,但是采樣的效率依賴于指定的分布的選擇,若是選擇的不好,會(huì)使得接受率 ...
2017-03-27MATLAB技巧—sort和sortrows函數(shù) 1、sort函數(shù) sort函數(shù)用于對(duì)數(shù)據(jù)進(jìn)行排序,通過help sort命令,可以查找到sort函數(shù)的具體用法: Y = SORT(X,DIM,MODE) has two optional parameters. DIM selects a dimensio ...
2017-03-27機(jī)器學(xué)習(xí)算法實(shí)踐—K-Means算法與圖像分割 一、理論準(zhǔn)備 1.1、圖像分割 圖像分割是圖像處理中的一種方法,圖像分割是指將一幅圖像分解成若干互不相交區(qū)域的集合,其實(shí)質(zhì)可以看成是一種像素的聚類過程。通常使用 ...
2017-03-27使用Python分析紐約出租車搭乘數(shù)據(jù) 在紐約,出租車分為兩類:黃色和綠色。黃色出租(Yellow TAXI)車可以在紐約五大區(qū)(布朗克斯區(qū)、布魯克林區(qū)、曼哈頓、皇后區(qū)、斯塔滕島)內(nèi)任何地點(diǎn)搭載乘客。綠色出租車(Gree ...
2017-03-27機(jī)器學(xué)習(xí)算法與Python實(shí)踐之(四)支持向量機(jī)(SVM)實(shí)現(xiàn) 八、SVM的實(shí)現(xiàn)之SMO算法 終于到SVM的實(shí)現(xiàn)部分了。那么神奇和有效的東西還得回歸到實(shí)現(xiàn)才可以展示其強(qiáng)大的功力。SVM有效而且存在很高效的訓(xùn)練算法, ...
2017-03-26機(jī)器學(xué)習(xí)算法與Python實(shí)踐之(三)支持向量機(jī)(SVM)進(jìn)階 五、核函數(shù) 如果我們的正常的樣本分布如下圖左邊所示,之所以說是正常的指的是,不是上面說的那樣由于某些頑固的離群點(diǎn)導(dǎo)致的線性不可分。它是真的 ...
2017-03-26機(jī)器學(xué)習(xí)算法與Python實(shí)踐之(二)支持向量機(jī)(SVM)初級(jí) 一、引入 支持向量機(jī)(SupportVector Machines),這個(gè)名字可是響當(dāng)當(dāng)?shù)?,在機(jī)器學(xué)習(xí)或者模式識(shí)別領(lǐng)域可是無人不知,無人不曉啊。八九十年代的時(shí)候 ...
2017-03-26機(jī)器學(xué)習(xí)算法與Python實(shí)踐之(一)k近鄰(KNN) 一、kNN算法分析 K最近鄰(k-Nearest Neighbor,KNN)分類算法可以說是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法了。它采用測(cè)量不同特征值之間的距離方法進(jìn)行分類。它的思想很簡(jiǎn) ...
2017-03-26簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—馬爾可夫鏈蒙特卡羅方法MCMC 對(duì)于一般的分布的采樣,在很多的編程語言中都有實(shí)現(xiàn),如最基本的滿足均勻分布的隨機(jī)數(shù),但是對(duì)于復(fù)雜的分布,要想對(duì)其采樣,卻沒有實(shí)現(xiàn)好的函數(shù),在這里, ...
2017-03-26Python基礎(chǔ)—網(wǎng)絡(luò)編程 在網(wǎng)絡(luò)編程中主要是使用Socket(套接字)進(jìn)行編程,套接字相當(dāng)于應(yīng)用程序訪問下層網(wǎng)絡(luò)的服務(wù)的接口,使用Socket可以是得不同主機(jī)之間進(jìn)行通信,從而實(shí)現(xiàn)數(shù)據(jù)交換。 1、Socket工作方式 套 ...
2017-03-26python—時(shí)間與時(shí)間戳之間的轉(zhuǎn)換 對(duì)于時(shí)間數(shù)據(jù),如2016-05-05 20:28:54,有時(shí)需要與時(shí)間戳進(jìn)行相互的運(yùn)算,此時(shí)就需要對(duì)兩種形式進(jìn)行轉(zhuǎn)換,在Python中,轉(zhuǎn)換時(shí)需要用到time模塊,具體的操作有如下的幾種: 將 ...
2017-03-25簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—Mean Shift聚類算法 一、Mean Shift算法概述 Mean Shift算法,又稱為均值漂移算法,Mean Shift的概念最早是由Fukunage在1975年提出的,在后來由Yizong Cheng對(duì)其進(jìn)行擴(kuò)充,主要提出 ...
2017-03-25《數(shù)學(xué)之美》拾遺—潛在語義索引(LSI) 一、潛在語義索引的提出 潛在語義索引(LSI),又稱為潛在語義分析(LSA),是在信息檢索領(lǐng)域提出來的一個(gè)概念。主要是在解決兩類問題,一類是一詞多義,如“bank”一詞 ...
2017-03-25《數(shù)學(xué)之美》拾遺—TF-IDF 在學(xué)習(xí)機(jī)器學(xué)習(xí)的過程中,我寫了簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法的專題,依然還有很多的算法會(huì)陸續(xù)寫出來。網(wǎng)上已經(jīng)有很多人分享過類似的材料,我只是通過自己的理解,想盡可能用一種通俗易懂 ...
2017-03-25簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法——協(xié)同過濾推薦算法(2) 一、基于協(xié)同過濾的推薦系統(tǒng) 協(xié)同過濾(Collaborative Filtering)的推薦系統(tǒng)的原理是通過將用戶和其他用戶的數(shù)據(jù)進(jìn)行比對(duì)來實(shí)現(xiàn)推薦的。比對(duì)的具體方法就是通過 ...
2017-03-25簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—協(xié)同過濾推薦算法(1) 一、推薦系統(tǒng)的概念 推薦系統(tǒng)(Recommendation System, RS),簡(jiǎn)單來說就是根據(jù)用戶的日常行為,自動(dòng)預(yù)測(cè)用戶的喜好,為用戶提供更多完善的服務(wù)。舉個(gè)簡(jiǎn)單的例子, ...
2017-03-25簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—主成分分析(PCA) 一、數(shù)據(jù)降維 對(duì)于現(xiàn)在維數(shù)比較多的數(shù)據(jù),我們首先需要做的就是對(duì)其進(jìn)行降維操作。降維,簡(jiǎn)單來說就是說在盡量保證數(shù)據(jù)本質(zhì)的前提下將數(shù)據(jù)中的維數(shù)降低。降維的操作 ...
2017-03-24簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—嶺回歸(Ridge Regression) 一、一般線性回歸遇到的問題 在處理復(fù)雜的數(shù)據(jù)的回歸問題時(shí),普通的線性回歸會(huì)遇到一些問題,主要表現(xiàn)在: 預(yù)測(cè)精度:這里要處理好這樣一對(duì)為題,即樣本的 ...
2017-03-24CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11