SPSS分析技術:線性回歸分析 相關分析可以揭示事物之間共同變化的一致性程度,但它僅僅只是反映出了一種相關關系,并沒有揭示出變量之間準確的可以運算的控制關系,也就是函數(shù)關系,不能解決針對未來的分析與預 ...
2017-02-28SPSS應用之非參數(shù)檢驗 統(tǒng)計學的假設檢驗可以分為參數(shù)檢驗和非參數(shù)檢驗,參數(shù)檢驗是根據(jù)一些假設條件推算而來,當這些假設條件無法滿足的時候,參數(shù)檢驗的效能會大打折扣,甚至出現(xiàn)錯誤的結果,而非參數(shù)檢驗通常 ...
2017-02-28R語言中的缺失值處理 在處理一些真實數(shù)據(jù)時,樣本中往往會包含缺失值(Missing values)。我們需要對缺失值進行適宜的處理,才能建立更為有效的模型,使得后續(xù)預測分析能有更小的偏差。本文將羅列不同的缺失值處 ...
2017-02-27R語言不平衡數(shù)據(jù)分類指南 目前我們發(fā)展出了不少機器學習算法來對數(shù)據(jù)建模,基于數(shù)據(jù)進行一些預測已經不再是難事。不論我們建立的是回歸或是分類模型,只要我們選擇了合適的算法,總能得到比較精確的結果。然而 ...
2017-02-27使用R寫入Excel方法總結 數(shù)據(jù)部門在和公司其他部門打交道過程中,將數(shù)據(jù)寫入Excel文件經常會涉及到(從各種臨時需求到日常數(shù)據(jù)報告Dashboard等等)。 通過Rdocumentation查詢write to excel,會有15個R包、2 ...
2017-02-27SPSS分析技術:描述統(tǒng)計;了解手中的數(shù)據(jù),從這里開始 無論是總體數(shù)據(jù)還是樣本數(shù)據(jù),描述統(tǒng)計都是了解它們的第一步,因為了解數(shù)據(jù)是進行進一步數(shù)據(jù)分析的基礎。在統(tǒng)計基礎文章中介紹過,描述數(shù)據(jù)可以從三個維度進 ...
2017-02-27SPSS統(tǒng)計分析案例:對應分析 兩個分類變量間的關系,無法直接使用常見的皮爾遜相關系數(shù)來表述,多采用頻數(shù)統(tǒng)計、交叉表卡方檢驗等過程進行處理,當分類變量的取值較多時,列聯(lián)表頻數(shù)的形式就變得更為復雜,很難 ...
2017-02-27SPSS常見函數(shù)及使用方法 SPSS函數(shù)是一個常用程序,并且利用一個或多個自變量(參數(shù))來執(zhí)行。每個SPSS函數(shù)均有一個關鍵名稱(keywordname),且絕不能寫錯。 通常,函數(shù)的格式為:函數(shù)名稱(自變量,自變量 ...
2017-02-27R語言中離群值的識別、描述、繪制與移除 統(tǒng)計學中離群值被定義為離開大部分觀測較遠的樣本點,多數(shù)是由于測量誤差而產生。因此,數(shù)據(jù)分析中離群值的識別和移除(如有必要)是很重要的一個步驟。 鑒 ...
2017-02-26教你如何用R進行數(shù)據(jù)挖掘 R是一種廣泛用于數(shù)據(jù)分析和統(tǒng)計計算的強大語言,于上世紀90年代開始發(fā)展起來。得益于全世界眾多 愛好者的無盡努力,大家繼而開發(fā)出了一種基于R但優(yōu)于R基本文本編輯器的R Studio(用戶 ...
2017-02-26使用R進行傾向得分匹配(PSM) 根據(jù)維基百科,傾向得分匹配(PSM)是一種用來評估處置效應的統(tǒng)計方法。廣義說來,它將樣本根據(jù)其特性分類,而不同類樣本間的差異就可以看作處置效應的無偏估計。因此,PSM不僅 ...
2017-02-26PageRank算法R語言實現(xiàn) Google搜索,早已成為我每天必用的工具,無數(shù)次驚嘆它搜索結果的準確性。同時,我也在做Google的SEO,推廣自己的博客。經過幾個月嘗試,我的博客PR到2了,外鏈也有幾萬個了。總結下來, ...
2017-02-26R語言解讀一元線性回歸模型 R語言作為統(tǒng)計學一門語言,一直在小眾領域閃耀著光芒。直到大數(shù)據(jù)的爆發(fā),R語言變成了一門炙手可熱的數(shù)據(jù)分析的利器。隨著越來越多的工程背景的人的加入,R語言的社區(qū)在迅速擴大成長 ...
2017-02-26用R語言建立學生的學習表現(xiàn)和性格特征數(shù)據(jù)模型 一、項目介紹: 方法包括以下步驟 S1:將個體表現(xiàn)數(shù)據(jù)輸入到數(shù)據(jù)庫; S2:建立學習者的學習表現(xiàn)數(shù)據(jù)庫和性格特征數(shù)據(jù)庫; S3:建立學習者的學習表現(xiàn) ...
2017-02-26用R語言作社群關系分析 在反映大量人群或事物之間的關系時,社交網(wǎng)絡圖可以清晰的展示’群體’的內含和外延。例如,群體的規(guī)模、核心、與其他群體的交疊情況。 社交關系圖來表示應用人數(shù)和之間的交疊關系, ...
2017-02-25使用R原生函數(shù)來做文本挖掘 最近有幾位同學問到我如何利用tm包做文本挖掘,比較抱歉的是時間不太充足,不能完整更新文檔。 在這里只好給大家一些tips,來利用R的原生函數(shù)來完成文本挖掘的核心步驟。 set ...
2017-02-25簡單的認識一下組合分類器以及R語言對應使用函數(shù) 首先,我們大家都有學習過一系列的分類方法,例如決策樹,貝葉斯分類器等,有時候分類的效果不太如人意,哪怕是參數(shù)是最優(yōu)化也一樣,所以這時候就需要一些提高 ...
2017-02-25R語言數(shù)據(jù)預處理 一、日期時間、字符串的處理 日期 Date: 日期類,年與日 POSIXct: 日期時間類,精確到秒,用數(shù)字表示 POSIXlt: 日期時間類,精確到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ...
2017-02-25R語言相關分布函數(shù)、統(tǒng)計函數(shù)的使用 R語言相關分布函數(shù)、統(tǒng)計函數(shù)的使用 分布函數(shù)家族: *func() r : 隨機分布函數(shù) d : 概率密度函數(shù) p : 累積分布函數(shù) q : 分位數(shù)函數(shù) func()表示具體的名稱 ...
2017-02-25R語言統(tǒng)計與分布的相關知識 變量 變量按變量值是否連續(xù)可分為連續(xù)變量與離散變量兩種。連續(xù)變量(continuous variable)與離散變量(discrete variable) 連續(xù)變量 在一定區(qū)間內可以任意取值的變量叫 ...
2017-02-252025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價值的煉金術》一書中指出:AI思維, ...
2025-07-17數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價值的橋梁? 在數(shù)據(jù)驅動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務數(shù)據(jù)分析:數(shù)據(jù)驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數(shù)字化轉型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數(shù)據(jù)庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數(shù)據(jù)分析:驅動企業(yè)高效決策的核心引擎? 在數(shù)字經濟時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學的瑞士軍刀? ? 在數(shù)據(jù)驅動的時代,面對海量、復雜的數(shù)據(jù),如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10