機器理解大數(shù)據(jù)的秘密:聚類算法深度詳解 在理解大數(shù)據(jù)方面,聚類是一種很常用的基本方法。近日,數(shù)據(jù)科學(xué)家兼程序員 Peter Gleeson 在 freeCodeCamp 發(fā)布了一篇深度講解文章,對一些聚類算法進行了基礎(chǔ)介紹, ...
2017-04-03SAS數(shù)組的使用 今天呢本想寫個基于信息增益的決策樹算法,突然發(fā)現(xiàn)把數(shù)組的使用方法給忘記了,那今天借介紹下SAS中數(shù)組的使用吧。 SAS把一組同為數(shù)值型或同為字符型的變量合在一起,使用同一個名字稱呼 ...
2017-04-03sas輸出基尼方差,F(xiàn)檢驗 有時候,我們在建模前期會有一個變量探索的單變量與因變量的數(shù)據(jù)分析報告,但其實,不同的數(shù)據(jù)形式有不同的指標(biāo)來衡量變量與因變量的解釋能力 今天的代碼介紹的就是單變量與因變量之 ...
2017-04-03關(guān)于缺失統(tǒng)計函數(shù)cmiss、nmiss中的小細節(jié) 在數(shù)據(jù)清理中統(tǒng)計缺失變量的缺失的時候,我們經(jīng)常會用到cmiss函數(shù)和nmiss函數(shù),這兩者都是用來對缺失個數(shù)進行統(tǒng)計,兩者區(qū)別就在于前者既能用于數(shù)值型也能用于字符型, ...
2017-04-03sas正則式之prxparse. Prxmatch 今天分享的是我這幾天用到的正則式的一個小總結(jié),這部分的內(nèi)容因為比較多,所以會分成幾篇文章分享。 其實我們在做數(shù)據(jù)的過程中老是會聽到別人說,r處理數(shù)據(jù)比sas好用,但是 ...
2017-04-03sas正則式之prxparen 今天還是要繼續(xù)正則式的內(nèi)容,這周的內(nèi)容是prxparen函數(shù),這個函數(shù)我個人覺得特別有用,是因為他和“|”結(jié)合使用可以同時容納很多種情況的字符串。 prxparse這個函數(shù)沒有什么參數(shù),就 ...
2017-04-03SAS DATA步之全解密 SAS DATA步對于SAS入門學(xué)習(xí)者來說是個難以理解的東西,因為SAS封裝了一些過程,這種封裝對于有語言基礎(chǔ)的人來說反而是一個障礙。本文非常詳細的解釋了SAS 數(shù)據(jù)的編譯、執(zhí)行過程,對于了解SA ...
2017-04-03SAS—format過程 format過程主要用來定義數(shù)值或符號文字的輸出和輸入格式。接下來看一個例子: /*format 過程定義了變量類型 income_desc*/ proc format ; value income_desc 0-<5000 = \'低收入\' ...
2017-04-02這十個經(jīng)典方法,是運營數(shù)據(jù)分析不能不會的 眼花繚亂的東西很多,真正派上用場的,卻不見得是那些看起來炫酷的。很多方法樸實無華,卻解決大量的問題。下面十個方法都是我這么多年做互聯(lián)網(wǎng)運營分析時一定會用 ...
2017-04-02SAS—freq、means過程 SAS—freq、means過程 proc means過程 means過程是SAS提供的一個數(shù)據(jù)匯總過程,單個或多個變量的簡單的描述性統(tǒng)計分析。 means過程語法: proc means <data = 數(shù)據(jù)集名><選項> ...
2017-04-02優(yōu)秀數(shù)據(jù)分析團隊?wèi)?yīng)該做好這些事情 Q:數(shù)據(jù)分析團隊如何給自己找活干? 當(dāng)業(yè)務(wù)部門沒有提出分析想法,各方面數(shù)據(jù)看板已經(jīng)做得很完善的情況下。數(shù)據(jù)分析團隊如何給自己找活干,面對那么多業(yè)務(wù)部門,如何從一個 ...
2017-04-02SAS信用評分九步曲之第一步數(shù)據(jù)清洗 累積了一段時間的建模經(jīng)驗了,這次想把我在建模中用的代碼分批分享出來,可能寫的東西不是你能用到的,畢竟我們接觸到的數(shù)據(jù)都不一樣。但是譬如文本清洗之類的,看我之前的 ...
2017-04-02SAS編程中的這些小問題你遇到過嗎 在用SAS編程時,總是時不時會遇到各種各樣的小問題,我本人也遇到過一些有意思的問題,在寫程序的過程中,為了避免這些小問題也慢慢的積累了一些經(jīng)驗,那么通過這一節(jié)分享給大 ...
2017-04-02從模型選擇到超參調(diào)整,六步教你如何為機器學(xué)習(xí)項目選擇算法 隨著機器學(xué)習(xí)的進一步火熱,越來越多的算法已經(jīng)可以用在許多任務(wù)的執(zhí)行上,并且表現(xiàn)出色。 但是動手之前到底哪個算法可以解決我們特定的實際問 ...
2017-04-01SAS一些有用的語句 今天本想繼續(xù)介紹 summary過程的,但是發(fā)現(xiàn)別人整理的比我更好,于是周末再更,好好整理一下描述性統(tǒng)計分析及評分卡建模,今天給大家介紹一些sas有用的語句吧。 1.如果在同一程序 ...
2017-04-01SAS運算符IN在宏語句中的應(yīng)用 作為一名SAS程序員,我想大家對運算符IN并不陌生,它廣泛的應(yīng)用于數(shù)據(jù)步或SQL條件語句中,進行條件判斷或數(shù)據(jù)篩選。請看下面的示例代碼: 今天我們想給大家介紹的是如何在 ...
2017-04-01留一交叉驗證及SAS代碼 在數(shù)據(jù)量很少,用什么模型?我們總結(jié)過當(dāng)數(shù)據(jù)量很少時如何選擇模型和方法,以使得數(shù)據(jù)能夠最大限度的得到利用。 其中有一個方法就是做交叉驗證。 我有備選的模型G(x1, x2, x3), G ...
2017-04-01【新手必備】SAS常用函數(shù)整理 本文根據(jù)網(wǎng)絡(luò)資源對SAS的常用函數(shù)進行了整理。主要內(nèi)容包括: 1. 數(shù)學(xué)函數(shù) 2. 數(shù)組函數(shù) 3. 字符函數(shù) 4. 日期和時間函數(shù) 5. 分布密度函數(shù),分布函數(shù) 6. 分位數(shù)函 ...
2017-04-01SAS—基于熵的連續(xù)變量的離散化 今天介紹下整個程序邏輯及sas代碼的詳細介紹。 首先宏 %BinContVard調(diào)用了宏%CandSplits;然后宏%CandSplits又調(diào)用宏 %BestSplit、%GValue;最后通過宏%ApplyMap應(yīng)用于數(shù) ...
2017-03-31sas單變量的特征分析 大炮,我有個煩惱,我領(lǐng)導(dǎo)最近老叫我單變量結(jié)合因變量分析,但是都是分段分析,我總是寫proc sql然后group by ,但是這個過程好無聊啊,有木有什么新的代碼,讓我可以分析的快點啊。 最 ...
2017-03-31訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11