兩種SAS代碼實(shí)現(xiàn)變量的缺失值頻數(shù)及占比 sas對(duì)缺失值的統(tǒng)計(jì),可得出缺失值的頻數(shù)及占比。以下為詳細(xì)程序代碼: /*首先是創(chuàng)建示例數(shù)據(jù)集*/ data tmp; infile datalines delimiter=\",\"; length var1 $8.; lengt ...
2017-03-31數(shù)據(jù)科學(xué)之—大數(shù)據(jù)知識(shí)體系大全 1、淺談數(shù)據(jù)科學(xué) 數(shù)據(jù)科學(xué)(Data Science)這一概念自大數(shù)據(jù)崛起也隨之成為數(shù)據(jù)領(lǐng)域的討論熱點(diǎn),從去年開始,“數(shù)據(jù)科學(xué)家”便成為了一個(gè)工作職位出現(xiàn)在各種招聘信息上。那 ...
2017-03-31SAS正則式之prxsubstr 以及prxnext 今天介紹的正則式中的prxsubstr函數(shù)以及prxnesth函數(shù)。 這兩個(gè)函數(shù)需要配合call使用,生成start以及l(fā)ength兩個(gè)變量以供后面的使用。先介紹基本的參數(shù)。 Call prxsubtr( ...
2017-03-31統(tǒng)計(jì)挖掘那些事:分層抽樣與交叉驗(yàn)證 1留出法(Hold out)與分層抽樣 留出法的意思就是直接將總數(shù)據(jù)D劃分為兩個(gè)對(duì)立集合,訓(xùn)練集S以及測(cè)試集T,我們有S+T=D,以及S交T等于空集; 舉個(gè)簡(jiǎn)單例子說(shuō)明, ...
2017-03-30通過(guò)IMPORT過(guò)程讀取外部文件數(shù)據(jù) 通過(guò)IMPORT過(guò)程讀取外部文件數(shù)據(jù) 除了可以通過(guò)DATA步讀取外部文本文件數(shù)據(jù)外,SAS還提供了IMPORT過(guò)程,通過(guò)它可以從外部數(shù)據(jù)源讀取數(shù)據(jù)并寫入到SAS數(shù)據(jù)集中。而且,如果使用 ...
2017-03-30sas信用評(píng)分之變量篩選 今天介紹變量初步選擇。這部分的內(nèi)容我就只介紹information –value,我這次做的模型用的邏輯回歸,后面會(huì)更新以基尼系數(shù)或者信息熵基礎(chǔ)的篩選變量,期待我把。 Iv值的介紹你們已經(jīng)很 ...
2017-03-30如何在SAS EG中展示DB2表的中文列標(biāo)識(shí) SAS EG中展示DB2表的中文列標(biāo)識(shí) SAS用戶經(jīng)常會(huì)使用SAS Enterprise Guide (簡(jiǎn)稱EG),通過(guò)SAS/ ACCESS to DB2 查看、獲取DB2中的表。 各種系統(tǒng)的開發(fā)人員經(jīng)常使用神 ...
2017-03-30訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù) 訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù) SAS提供了一組訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)的SAS/ACCESS接口,每種接口有單獨(dú)的許可。使用這些接口,SAS可以和其他廠商數(shù)據(jù)庫(kù)中的數(shù)據(jù)交互。SAS所支持的關(guān) ...
2017-03-30SAS程序錯(cuò)誤及處理 通常我們所開發(fā)的SAS程序,很少在第一次提交時(shí)就能夠運(yùn)行完成并產(chǎn)生正確結(jié)果。程序越長(zhǎng)越復(fù)雜,就越可能出現(xiàn)語(yǔ)法或邏輯錯(cuò)誤。本文介紹了一些良好的SAS編程規(guī)范以減少程序錯(cuò)誤,同時(shí)也描述了 ...
2017-03-30SAS字符操作 在sas數(shù)據(jù)清洗與整理過(guò)程會(huì)接觸到兩類型數(shù)據(jù),字符型和數(shù)值型,并且sas只會(huì)以這兩種形勢(shì)出現(xiàn)。不會(huì)像R一樣出現(xiàn)列表、數(shù)組、矩陣、數(shù)據(jù)框、日期等多種形勢(shì)。Sas中關(guān)于數(shù)值型的操作大家并不陌生,所 ...
2017-03-29SAS信用評(píng)分之邏輯回歸的變量選擇 關(guān)于woe的轉(zhuǎn)化,這一部在之前的這篇文章:sas批量輸出變量woe值中已經(jīng)寫了,woe也只是簡(jiǎn)單的公式轉(zhuǎn)化而已,所以在這系列中就不細(xì)究了哈。這次的文章我想來(lái)講邏輯回歸。你會(huì)說(shuō) ...
2017-03-29SAS與R如何連接Oracle、DB2 職業(yè)是數(shù)據(jù)分析師,近2年給商業(yè)銀行做數(shù)據(jù)分析和數(shù)據(jù)挖掘。在商業(yè)銀行中,數(shù)據(jù)庫(kù)多用Oracle和DB2,分析工具多使用SAS和R。如何將分析工具SAS、R與數(shù)據(jù)庫(kù)Oracle、DB2建立連接,是數(shù)據(jù) ...
2017-03-29SAS分組合并數(shù)據(jù) 昨天臨睡前看到有人問(wèn)我sas怎么分組并對(duì)數(shù)據(jù)進(jìn)行合并,于是寫了一個(gè)例子,希望對(duì)大家有所啟發(fā)。 合并前的數(shù)據(jù)集: 合并后的數(shù)據(jù)集: 主要是利用了retain語(yǔ)句,以下是代碼: ...
2017-03-29SAS SQL select…into語(yǔ)句創(chuàng)建宏變量巧妙解決問(wèn)題的總結(jié) 今在某SAS交流群看到這樣一個(gè)問(wèn)題如下: 有一個(gè)數(shù)據(jù)集a,有三個(gè)變量c,b,d(他們?cè)跀?shù)據(jù)集中的順序也是如此),想新建一個(gè)變量var,并添加到b和d中間,怎 ...
2017-03-29優(yōu)化算法—擬牛頓法之DFP算法 一、牛頓法 在博文“優(yōu)化算法——牛頓法(Newton Method)”中介紹了牛頓法的思路,牛頓法具有二階收斂性,相比較最速下降法,收斂的速度更快。在牛頓法中使用到了函數(shù)的二階導(dǎo)數(shù) ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—譜聚類(Spectal Clustering) 一、復(fù)雜網(wǎng)絡(luò)中的一些基本概念 1、復(fù)雜網(wǎng)絡(luò)的表示 在復(fù)雜網(wǎng)絡(luò)的表示中,復(fù)雜網(wǎng)絡(luò)可以建模成一個(gè)圖,其中,V表示網(wǎng)絡(luò)中的節(jié)點(diǎn)的集合,E表示的是連 ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting兩種方法,隨機(jī)森林算法是基于Bagging思想的機(jī)器學(xué)習(xí)算法,在Bagging方法中,主要通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集 ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—集成方法(Ensemble Method) 一、集成學(xué)習(xí)方法的思想 前面介紹了一系列的算法,每個(gè)算法有不同的適用范圍,例如有處理線性可分問(wèn)題的,有處理線性不可分問(wèn)題。在現(xiàn)實(shí)世界的生活中, ...
2017-03-28機(jī)器學(xué)習(xí)中的常見(jiàn)問(wèn)題—損失函數(shù) 一、分類算法中的損失函數(shù) 在分類算法中,損失函數(shù)通??梢员硎境蓳p失項(xiàng)和正則項(xiàng)的和,即有如下的形式: 其中,L(mi(w))為損失項(xiàng),R(w)為正則項(xiàng)。mi的具體形式如下 ...
2017-03-28SAS信用卡評(píng)分之變量分段 這一篇的文章來(lái)講變量分段,在我之前的文章中,涉及到變量分段的代碼是有的,早開始的等高等寬分啊,后面的基于基尼系數(shù)以及基于iv值對(duì)于字符變量的分類都有。鏈接在這,這!這!這!。 ...
2017-03-28CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11