使用R進(jìn)行統(tǒng)計(jì)分析--概率計(jì)算 R語(yǔ)言中提供了很多概率函數(shù),可以方便的計(jì)算事件發(fā)生的概率。如二項(xiàng)分布概率函數(shù)和泊松分布概率函數(shù)。本篇文章介紹如果使用R語(yǔ)言中的這些函數(shù)求解事件發(fā)生的概率。 概率函 ...
2017-02-24使用R進(jìn)行統(tǒng)計(jì)分析--假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)中的一種推斷方法,用來(lái)判斷兩個(gè)樣本或總體間的差異是由于抽樣誤差引起的還是本質(zhì)差別造成的。R語(yǔ)言中提供了很多假設(shè)檢驗(yàn)函數(shù),如F檢驗(yàn),t檢驗(yàn)和卡方檢驗(yàn)等等。本 ...
2017-02-24用R語(yǔ)言做網(wǎng)頁(yè)爬蟲和文本分析 受到這篇情感分析的文章和這篇網(wǎng)頁(yè)爬蟲指南的雙重啟發(fā),我決定嘗試抓取并分析 Goodreads 網(wǎng)站的書評(píng)數(shù)據(jù)。這個(gè)項(xiàng)目將會(huì)呈現(xiàn)一個(gè)從數(shù)據(jù)收集到機(jī)器學(xué)習(xí)建模分析的完整案例,我在中途 ...
2017-02-24R語(yǔ)言中的t檢驗(yàn) 問題 在R中,我們?nèi)绾螜z驗(yàn)從總體中抽樣得到的兩組樣本是否有不同的均值,或是通過總體中的某一組樣本檢驗(yàn)總體均值與某一理論均值間的差異。 指南 示例數(shù)據(jù) 我們選擇內(nèi)置的sleep數(shù)據(jù)集 ...
2017-02-24R語(yǔ)言的三種聚類方法 一、層次聚類 1)距離和相似系數(shù) r語(yǔ)言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 來(lái)計(jì)算距離。其中x是樣本矩陣或者數(shù)據(jù)框。method表示計(jì)算哪種距離 ...
2017-02-24使用R讀取并查看數(shù)據(jù) 本篇文章介紹如何使用R語(yǔ)言讀取并查看數(shù)據(jù),包含一些最基礎(chǔ)的函數(shù)使用方法和說(shuō)明。后面還會(huì)陸續(xù)介紹數(shù)據(jù)清洗,匹配和提取等相關(guān)的操作。 查看函數(shù)幫助 對(duì)于新手來(lái)說(shuō),在使用R時(shí)最重 ...
2017-02-24使用R實(shí)現(xiàn)一個(gè)簡(jiǎn)單的連續(xù)系統(tǒng)模擬 連續(xù)系統(tǒng)就是指狀態(tài)隨著時(shí)間連續(xù)變化的系統(tǒng)。我們通過計(jì)算機(jī)模擬對(duì)連續(xù)系統(tǒng)得到的結(jié)果只是近似的,但如果只要這種近似達(dá)到了一定的精度,也就可以滿足要求。 連續(xù)系統(tǒng)模擬的一 ...
2017-02-23R語(yǔ)言apply族函數(shù)詳解 在R語(yǔ)言中,apply系列函數(shù)的基本作用是對(duì)數(shù)組(array,可以是多維)或者列表(list)按照元素或元素構(gòu)成的子集合進(jìn)行迭代,并將當(dāng)前元素或子集合作為參數(shù)調(diào)用某個(gè)指定函數(shù)。apply族函數(shù)分 ...
2017-02-23R語(yǔ)言之矩陣操作 R語(yǔ)言作為一門統(tǒng)計(jì)語(yǔ)言,肯定缺少不了矩陣處理。下面是我參考《R語(yǔ)言與數(shù)據(jù)挖掘》總結(jié)出來(lái)以下關(guān)于矩陣運(yùn)算的函數(shù),其中包括矩陣的求和,轉(zhuǎn)置,等。 接下來(lái)我們通過一些例子來(lái)了解一下這些函 ...
2017-02-23PythonVSR語(yǔ)言?數(shù)據(jù)分析與挖掘該選哪一個(gè) 什么是R語(yǔ)言? R語(yǔ)言,一種自由軟件編程語(yǔ)言與操作環(huán)境,主要用于統(tǒng)計(jì)分析、繪圖、數(shù)據(jù)挖掘。R本來(lái)是由來(lái)自新西蘭奧克蘭大學(xué)的羅斯·伊哈卡和羅伯特·杰特曼開發(fā)(也 ...
2017-02-23R語(yǔ)言之RMySQL包 一、RMySQL的安裝(主要是windows) 這個(gè)包最近的跟新版貌似可以直接安裝了,之前的版本還需要各種配置。 installed.packages(\"DBI\") #這個(gè)包是使用RMySQL的前提 installed.package ...
2017-02-230歲數(shù)據(jù)分析師的入門指南 初入數(shù)據(jù)分析行業(yè)的同學(xué)或還在門口徘徊想要從事數(shù)據(jù)分析職業(yè)的同學(xué)常常會(huì)比較困惑,非常迫切地想要知道作為一個(gè)數(shù)據(jù)分析師,到底需要掌握那些技能,這里筆者作為過來(lái)人給到大家一點(diǎn)建 ...
2017-02-23使用R進(jìn)行數(shù)據(jù)提取 數(shù)據(jù)提取是數(shù)據(jù)分析日常工作中遇到最多的需求,本篇文章介紹如何通過R按特定的維度或條件對(duì)數(shù)據(jù)進(jìn)行提取,完成數(shù)據(jù)提取需求。 讀取并創(chuàng)建數(shù)據(jù)表 首先第一步是讀取數(shù)據(jù),并創(chuàng)建名稱 ...
2017-02-22R語(yǔ)言案例分析:多元數(shù)據(jù)的基本統(tǒng)計(jì)分析 我們利用該數(shù)據(jù)集中的Case1來(lái)完成下面的R語(yǔ)言操作: > options(digits = 4) #輸出結(jié)果位數(shù) > par(mar=c(4, 4, 2, 1) + 0.1, cex=0.8) # 圖形修飾 > case1 <- rea ...
2017-02-22生成滯后數(shù)據(jù),滯后階數(shù)自己設(shè)定-R語(yǔ)言 rm(list = ls()) #首先讀取數(shù)據(jù) data1<-read.csv(\"原始數(shù)據(jù).csv\",header=T,stringsAsFactors=F)#讀入數(shù)據(jù) #如果是xlsx格式數(shù)據(jù)可以調(diào)用xlsx包,讀取方法如下 #li ...
2017-02-22R語(yǔ)言knitr之rmarkdown 數(shù)據(jù)報(bào)告是作為數(shù)據(jù)分析師必不可少的工作之一,而目前大部分?jǐn)?shù)據(jù)分析師所處環(huán)境可能是excel畫圖制表,然后制作成word或者email的方式。對(duì)于周期性的報(bào)告,每次重復(fù)操作其實(shí)蠻痛苦的。 ...
2017-02-22用R語(yǔ)言做簡(jiǎn)單的數(shù)據(jù)清洗 昨天和學(xué)長(zhǎng)聊到下周要做的數(shù)據(jù)清洗工作,心想應(yīng)該很好上手吧,結(jié)果今早爬起來(lái)一問度娘,立馬就被灌了整鍋的毒雞湯…某論壇上的網(wǎng)友甚至告訴小編,數(shù)據(jù)清洗占了他某項(xiàng)工作中的八成分量 ...
2017-02-22數(shù)據(jù)批處理--R語(yǔ)言里最重要的一個(gè)函數(shù)家族:*pply 之前我們講過循環(huán),簡(jiǎn)單講解了向量計(jì)算,它可以代替循環(huán)進(jìn)行比較搞笑的批量計(jì)算,試想計(jì)算數(shù)據(jù)框中的總收入加上10,我們沒必要進(jìn)行循環(huán)計(jì)算這一列的每一個(gè)元素 ...
2017-02-22R語(yǔ)言畫數(shù)據(jù)圖形 plot是一般的畫圖函數(shù),hist是直方圖,boxplot是箱型圖。這些函數(shù)會(huì)覆蓋前面的圖形,如何創(chuàng)建多個(gè)圖形便于同時(shí)查看呢?方法有三: 1、創(chuàng)建新圖形之前先打開一個(gè)新的圖形窗口,每一幅新圖形 ...
2017-02-21R語(yǔ)言和Python—一個(gè)錯(cuò)誤的分裂 最近有一些文章提出與年齡相關(guān)的問題:“嶄露頭角的年輕數(shù)據(jù)科學(xué)家們是學(xué)習(xí)R語(yǔ)言還是Python更好?” 答案似乎都是“視情況而定”,在現(xiàn)實(shí)中沒有必要在R和Python中做出選擇,因 ...
2017-02-212025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù)》一書中指出:AI思維, ...
2025-07-17數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10