兩種SAS代碼實(shí)現(xiàn)變量的缺失值頻數(shù)及占比 sas對(duì)缺失值的統(tǒng)計(jì),可得出缺失值的頻數(shù)及占比。以下為詳細(xì)程序代碼: /*首先是創(chuàng)建示例數(shù)據(jù)集*/ data tmp; infile datalines delimiter=\",\"; length var1 $8.; lengt ...
2017-03-31數(shù)據(jù)科學(xué)之—大數(shù)據(jù)知識(shí)體系大全 1、淺談數(shù)據(jù)科學(xué) 數(shù)據(jù)科學(xué)(Data Science)這一概念自大數(shù)據(jù)崛起也隨之成為數(shù)據(jù)領(lǐng)域的討論熱點(diǎn),從去年開始,“數(shù)據(jù)科學(xué)家”便成為了一個(gè)工作職位出現(xiàn)在各種招聘信息上。那 ...
2017-03-31SAS正則式之prxsubstr 以及prxnext 今天介紹的正則式中的prxsubstr函數(shù)以及prxnesth函數(shù)。 這兩個(gè)函數(shù)需要配合call使用,生成start以及l(fā)ength兩個(gè)變量以供后面的使用。先介紹基本的參數(shù)。 Call prxsubtr( ...
2017-03-31統(tǒng)計(jì)挖掘那些事:分層抽樣與交叉驗(yàn)證 1留出法(Hold out)與分層抽樣 留出法的意思就是直接將總數(shù)據(jù)D劃分為兩個(gè)對(duì)立集合,訓(xùn)練集S以及測(cè)試集T,我們有S+T=D,以及S交T等于空集; 舉個(gè)簡(jiǎn)單例子說(shuō)明, ...
2017-03-30通過(guò)IMPORT過(guò)程讀取外部文件數(shù)據(jù) 通過(guò)IMPORT過(guò)程讀取外部文件數(shù)據(jù) 除了可以通過(guò)DATA步讀取外部文本文件數(shù)據(jù)外,SAS還提供了IMPORT過(guò)程,通過(guò)它可以從外部數(shù)據(jù)源讀取數(shù)據(jù)并寫入到SAS數(shù)據(jù)集中。而且,如果使用 ...
2017-03-30sas信用評(píng)分之變量篩選 今天介紹變量初步選擇。這部分的內(nèi)容我就只介紹information –value,我這次做的模型用的邏輯回歸,后面會(huì)更新以基尼系數(shù)或者信息熵基礎(chǔ)的篩選變量,期待我把。 Iv值的介紹你們已經(jīng)很 ...
2017-03-30如何在SAS EG中展示DB2表的中文列標(biāo)識(shí) SAS EG中展示DB2表的中文列標(biāo)識(shí) SAS用戶經(jīng)常會(huì)使用SAS Enterprise Guide (簡(jiǎn)稱EG),通過(guò)SAS/ ACCESS to DB2 查看、獲取DB2中的表。 各種系統(tǒng)的開發(fā)人員經(jīng)常使用神 ...
2017-03-30訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù) 訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù) SAS提供了一組訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)的SAS/ACCESS接口,每種接口有單獨(dú)的許可。使用這些接口,SAS可以和其他廠商數(shù)據(jù)庫(kù)中的數(shù)據(jù)交互。SAS所支持的關(guān) ...
2017-03-30SAS程序錯(cuò)誤及處理 通常我們所開發(fā)的SAS程序,很少在第一次提交時(shí)就能夠運(yùn)行完成并產(chǎn)生正確結(jié)果。程序越長(zhǎng)越復(fù)雜,就越可能出現(xiàn)語(yǔ)法或邏輯錯(cuò)誤。本文介紹了一些良好的SAS編程規(guī)范以減少程序錯(cuò)誤,同時(shí)也描述了 ...
2017-03-30SAS字符操作 在sas數(shù)據(jù)清洗與整理過(guò)程會(huì)接觸到兩類型數(shù)據(jù),字符型和數(shù)值型,并且sas只會(huì)以這兩種形勢(shì)出現(xiàn)。不會(huì)像R一樣出現(xiàn)列表、數(shù)組、矩陣、數(shù)據(jù)框、日期等多種形勢(shì)。Sas中關(guān)于數(shù)值型的操作大家并不陌生,所 ...
2017-03-29SAS信用評(píng)分之邏輯回歸的變量選擇 關(guān)于woe的轉(zhuǎn)化,這一部在之前的這篇文章:sas批量輸出變量woe值中已經(jīng)寫了,woe也只是簡(jiǎn)單的公式轉(zhuǎn)化而已,所以在這系列中就不細(xì)究了哈。這次的文章我想來(lái)講邏輯回歸。你會(huì)說(shuō) ...
2017-03-29SAS與R如何連接Oracle、DB2 職業(yè)是數(shù)據(jù)分析師,近2年給商業(yè)銀行做數(shù)據(jù)分析和數(shù)據(jù)挖掘。在商業(yè)銀行中,數(shù)據(jù)庫(kù)多用Oracle和DB2,分析工具多使用SAS和R。如何將分析工具SAS、R與數(shù)據(jù)庫(kù)Oracle、DB2建立連接,是數(shù)據(jù) ...
2017-03-29SAS分組合并數(shù)據(jù) 昨天臨睡前看到有人問(wèn)我sas怎么分組并對(duì)數(shù)據(jù)進(jìn)行合并,于是寫了一個(gè)例子,希望對(duì)大家有所啟發(fā)。 合并前的數(shù)據(jù)集: 合并后的數(shù)據(jù)集: 主要是利用了retain語(yǔ)句,以下是代碼: ...
2017-03-29SAS SQL select…into語(yǔ)句創(chuàng)建宏變量巧妙解決問(wèn)題的總結(jié) 今在某SAS交流群看到這樣一個(gè)問(wèn)題如下: 有一個(gè)數(shù)據(jù)集a,有三個(gè)變量c,b,d(他們?cè)跀?shù)據(jù)集中的順序也是如此),想新建一個(gè)變量var,并添加到b和d中間,怎 ...
2017-03-29優(yōu)化算法—擬牛頓法之DFP算法 一、牛頓法 在博文“優(yōu)化算法——牛頓法(Newton Method)”中介紹了牛頓法的思路,牛頓法具有二階收斂性,相比較最速下降法,收斂的速度更快。在牛頓法中使用到了函數(shù)的二階導(dǎo)數(shù) ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—譜聚類(Spectal Clustering) 一、復(fù)雜網(wǎng)絡(luò)中的一些基本概念 1、復(fù)雜網(wǎng)絡(luò)的表示 在復(fù)雜網(wǎng)絡(luò)的表示中,復(fù)雜網(wǎng)絡(luò)可以建模成一個(gè)圖,其中,V表示網(wǎng)絡(luò)中的節(jié)點(diǎn)的集合,E表示的是連 ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—AdaBoost 一、集成方法(Ensemble Method) 集成方法主要包括Bagging和Boosting兩種方法,隨機(jī)森林算法是基于Bagging思想的機(jī)器學(xué)習(xí)算法,在Bagging方法中,主要通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集 ...
2017-03-28簡(jiǎn)單易學(xué)的機(jī)器學(xué)習(xí)算法—集成方法(Ensemble Method) 一、集成學(xué)習(xí)方法的思想 前面介紹了一系列的算法,每個(gè)算法有不同的適用范圍,例如有處理線性可分問(wèn)題的,有處理線性不可分問(wèn)題。在現(xiàn)實(shí)世界的生活中, ...
2017-03-28機(jī)器學(xué)習(xí)中的常見問(wèn)題—損失函數(shù) 一、分類算法中的損失函數(shù) 在分類算法中,損失函數(shù)通??梢员硎境蓳p失項(xiàng)和正則項(xiàng)的和,即有如下的形式: 其中,L(mi(w))為損失項(xiàng),R(w)為正則項(xiàng)。mi的具體形式如下 ...
2017-03-28SAS信用卡評(píng)分之變量分段 這一篇的文章來(lái)講變量分段,在我之前的文章中,涉及到變量分段的代碼是有的,早開始的等高等寬分啊,后面的基于基尼系數(shù)以及基于iv值對(duì)于字符變量的分類都有。鏈接在這,這!這!這!。 ...
2017-03-28訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11