SPSS分析技術(shù):線性回歸分析 相關(guān)分析可以揭示事物之間共同變化的一致性程度,但它僅僅只是反映出了一種相關(guān)關(guān)系,并沒有揭示出變量之間準(zhǔn)確的可以運(yùn)算的控制關(guān)系,也就是函數(shù)關(guān)系,不能解決針對未來的分析與預(yù) ...
2017-02-28SPSS應(yīng)用之非參數(shù)檢驗(yàn) 統(tǒng)計(jì)學(xué)的假設(shè)檢驗(yàn)可以分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn),參數(shù)檢驗(yàn)是根據(jù)一些假設(shè)條件推算而來,當(dāng)這些假設(shè)條件無法滿足的時候,參數(shù)檢驗(yàn)的效能會大打折扣,甚至出現(xiàn)錯誤的結(jié)果,而非參數(shù)檢驗(yàn)通常 ...
2017-02-28R語言中的缺失值處理 在處理一些真實(shí)數(shù)據(jù)時,樣本中往往會包含缺失值(Missing values)。我們需要對缺失值進(jìn)行適宜的處理,才能建立更為有效的模型,使得后續(xù)預(yù)測分析能有更小的偏差。本文將羅列不同的缺失值處 ...
2017-02-27R語言不平衡數(shù)據(jù)分類指南 目前我們發(fā)展出了不少機(jī)器學(xué)習(xí)算法來對數(shù)據(jù)建模,基于數(shù)據(jù)進(jìn)行一些預(yù)測已經(jīng)不再是難事。不論我們建立的是回歸或是分類模型,只要我們選擇了合適的算法,總能得到比較精確的結(jié)果。然而 ...
2017-02-27使用R寫入Excel方法總結(jié) 數(shù)據(jù)部門在和公司其他部門打交道過程中,將數(shù)據(jù)寫入Excel文件經(jīng)常會涉及到(從各種臨時需求到日常數(shù)據(jù)報告Dashboard等等)。 通過Rdocumentation查詢write to excel,會有15個R包、2 ...
2017-02-27SPSS分析技術(shù):描述統(tǒng)計(jì);了解手中的數(shù)據(jù),從這里開始 無論是總體數(shù)據(jù)還是樣本數(shù)據(jù),描述統(tǒng)計(jì)都是了解它們的第一步,因?yàn)榱私鈹?shù)據(jù)是進(jìn)行進(jìn)一步數(shù)據(jù)分析的基礎(chǔ)。在統(tǒng)計(jì)基礎(chǔ)文章中介紹過,描述數(shù)據(jù)可以從三個維度進(jìn) ...
2017-02-27SPSS統(tǒng)計(jì)分析案例:對應(yīng)分析 兩個分類變量間的關(guān)系,無法直接使用常見的皮爾遜相關(guān)系數(shù)來表述,多采用頻數(shù)統(tǒng)計(jì)、交叉表卡方檢驗(yàn)等過程進(jìn)行處理,當(dāng)分類變量的取值較多時,列聯(lián)表頻數(shù)的形式就變得更為復(fù)雜,很難 ...
2017-02-27SPSS常見函數(shù)及使用方法 SPSS函數(shù)是一個常用程序,并且利用一個或多個自變量(參數(shù))來執(zhí)行。每個SPSS函數(shù)均有一個關(guān)鍵名稱(keywordname),且絕不能寫錯。 通常,函數(shù)的格式為:函數(shù)名稱(自變量,自變量 ...
2017-02-27R語言中離群值的識別、描述、繪制與移除 統(tǒng)計(jì)學(xué)中離群值被定義為離開大部分觀測較遠(yuǎn)的樣本點(diǎn),多數(shù)是由于測量誤差而產(chǎn)生。因此,數(shù)據(jù)分析中離群值的識別和移除(如有必要)是很重要的一個步驟。 鑒 ...
2017-02-26教你如何用R進(jìn)行數(shù)據(jù)挖掘 R是一種廣泛用于數(shù)據(jù)分析和統(tǒng)計(jì)計(jì)算的強(qiáng)大語言,于上世紀(jì)90年代開始發(fā)展起來。得益于全世界眾多 愛好者的無盡努力,大家繼而開發(fā)出了一種基于R但優(yōu)于R基本文本編輯器的R Studio(用戶 ...
2017-02-26使用R進(jìn)行傾向得分匹配(PSM) 根據(jù)維基百科,傾向得分匹配(PSM)是一種用來評估處置效應(yīng)的統(tǒng)計(jì)方法。廣義說來,它將樣本根據(jù)其特性分類,而不同類樣本間的差異就可以看作處置效應(yīng)的無偏估計(jì)。因此,PSM不僅 ...
2017-02-26PageRank算法R語言實(shí)現(xiàn) Google搜索,早已成為我每天必用的工具,無數(shù)次驚嘆它搜索結(jié)果的準(zhǔn)確性。同時,我也在做Google的SEO,推廣自己的博客。經(jīng)過幾個月嘗試,我的博客PR到2了,外鏈也有幾萬個了??偨Y(jié)下來, ...
2017-02-26R語言解讀一元線性回歸模型 R語言作為統(tǒng)計(jì)學(xué)一門語言,一直在小眾領(lǐng)域閃耀著光芒。直到大數(shù)據(jù)的爆發(fā),R語言變成了一門炙手可熱的數(shù)據(jù)分析的利器。隨著越來越多的工程背景的人的加入,R語言的社區(qū)在迅速擴(kuò)大成長 ...
2017-02-26用R語言建立學(xué)生的學(xué)習(xí)表現(xiàn)和性格特征數(shù)據(jù)模型 一、項(xiàng)目介紹: 方法包括以下步驟 S1:將個體表現(xiàn)數(shù)據(jù)輸入到數(shù)據(jù)庫; S2:建立學(xué)習(xí)者的學(xué)習(xí)表現(xiàn)數(shù)據(jù)庫和性格特征數(shù)據(jù)庫; S3:建立學(xué)習(xí)者的學(xué)習(xí)表現(xiàn) ...
2017-02-26用R語言作社群關(guān)系分析 在反映大量人群或事物之間的關(guān)系時,社交網(wǎng)絡(luò)圖可以清晰的展示’群體’的內(nèi)含和外延。例如,群體的規(guī)模、核心、與其他群體的交疊情況。 社交關(guān)系圖來表示應(yīng)用人數(shù)和之間的交疊關(guān)系, ...
2017-02-25使用R原生函數(shù)來做文本挖掘 最近有幾位同學(xué)問到我如何利用tm包做文本挖掘,比較抱歉的是時間不太充足,不能完整更新文檔。 在這里只好給大家一些tips,來利用R的原生函數(shù)來完成文本挖掘的核心步驟。 set ...
2017-02-25簡單的認(rèn)識一下組合分類器以及R語言對應(yīng)使用函數(shù) 首先,我們大家都有學(xué)習(xí)過一系列的分類方法,例如決策樹,貝葉斯分類器等,有時候分類的效果不太如人意,哪怕是參數(shù)是最優(yōu)化也一樣,所以這時候就需要一些提高 ...
2017-02-25R語言數(shù)據(jù)預(yù)處理 一、日期時間、字符串的處理 日期 Date: 日期類,年與日 POSIXct: 日期時間類,精確到秒,用數(shù)字表示 POSIXlt: 日期時間類,精確到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ...
2017-02-25R語言相關(guān)分布函數(shù)、統(tǒng)計(jì)函數(shù)的使用 R語言相關(guān)分布函數(shù)、統(tǒng)計(jì)函數(shù)的使用 分布函數(shù)家族: *func() r : 隨機(jī)分布函數(shù) d : 概率密度函數(shù) p : 累積分布函數(shù) q : 分位數(shù)函數(shù) func()表示具體的名稱 ...
2017-02-25R語言統(tǒng)計(jì)與分布的相關(guān)知識 變量 變量按變量值是否連續(xù)可分為連續(xù)變量與離散變量兩種。連續(xù)變量(continuous variable)與離散變量(discrete variable) 連續(xù)變量 在一定區(qū)間內(nèi)可以任意取值的變量叫 ...
2017-02-25訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11