
用R語言進行數(shù)據(jù)分析:常用函數(shù)參考
對于很多數(shù)據(jù)分析師來說,R語言都不陌生,應為在做數(shù)據(jù)分析時,常會用到它,下面是我總結用R語言進行數(shù)據(jù)分析:常用函數(shù)參考。希望對你們有所幫助。
基本 一、數(shù)據(jù)管理 vector:向量 numeric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列表
data.frame:數(shù)據(jù)框 c:連接為向量或列表 length:求長度 subset:求子集 seq,from:to,sequence:等差序列
rep:重復 NA:缺失值 NULL:空對象 sort,order,unique,rev:排序 unlist:展平列表 attr,attributes:對象屬性
mode,typeof:對象存儲模式與類型 names:對象的名字屬性 二、字符串處理 character:字符型向量 nchar:字符數(shù) substr:取子串 format,formatC:把對象用格式轉換為字符串 paste,strsplit:連接或拆分
charmatch,pmatch:字符串匹配 grep,sub,gsub:模式匹配與替換 三、復數(shù) complex,Re,Im,Mod,Arg,Conj:復數(shù)函數(shù) 四、因子 factor:因子 codes:因子的編碼 levels:因子的各水平的名字 nlevels:因子的水平個數(shù) cut:把數(shù)值型對象分區(qū)間轉換為因子
table:交叉頻數(shù)表 split:按因子分組 aggregate:計算各數(shù)據(jù)子集的概括統(tǒng)計量 tapply:對“不規(guī)則”數(shù)組應用函數(shù) 數(shù)學 一、計算 +, -, *, /, ^, %%, %/%:四則運算 ceiling,floor,round,signif,trunc,zapsmall:舍入 max,min,pmax,pmin:最大最小值
range:最大值和最小值 sum,prod:向量元素和,積 cumsum,cumprod,cummax,cummin:累加、累乘 sort:排序 approx和approx fun:插值 diff:差分 sign:符號函數(shù) 二、數(shù)學函數(shù) abs,sqrt:絕對值,平方根 log, exp, log10, log2:對數(shù)與指數(shù)函數(shù) sin,cos,tan,asin,acos,atan,atan2:三角函數(shù)
sinh,cosh,tanh,asinh,acosh,atanh:雙曲函數(shù) beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:與貝塔函數(shù)、伽瑪函數(shù)、組合數(shù)有關的特殊函數(shù) fft,mvfft,convolve:富利葉變換及卷積 polyroot:多項式求根 poly:正交多項式 spline,splinefun:樣條差值
besselI,besselK,besselJ,besselY,gammaCody:Bessel函數(shù) deriv:簡單表達式的符號微分或算法微分 三、數(shù)組 array:建立數(shù)組 matrix:生成矩陣 data.matrix:把數(shù)據(jù)框轉換為數(shù)值型矩陣 lower.tri:矩陣的下三角部分 mat.or.vec:生成矩陣或向量 t:矩陣轉置
cbind:把列合并為矩陣 rbind:把行合并為矩陣 diag:矩陣對角元素向量或生成對角矩陣 aperm:數(shù)組轉置 nrow, ncol:計算數(shù)組的行數(shù)和列數(shù) dim:對象的維向量
dimnames:對象的維名 row/colnames:行名或列名 %*%:矩陣乘法 crossprod:矩陣交叉乘積(內積) outer:數(shù)組外積 kronecker:數(shù)組的Kronecker積
apply:對數(shù)組的某些維應用函數(shù) tapply:對“不規(guī)則”數(shù)組應用函數(shù) sweep:計算數(shù)組的概括統(tǒng)計量 aggregate:計算數(shù)據(jù)子集的概括統(tǒng)計量 scale:矩陣標準化
matplot:對矩陣各列繪圖 cor:相關陣或協(xié)差陣 Contrast:對照矩陣 row:矩陣的行下標集 col:求列下標集 四、線性代數(shù) solve:解線性方程組或求逆 eigen:矩陣的特征值分解 svd:矩陣的奇異值分解 backsolve:解上三角或下三角方程組 chol:Choleski分解
qr:矩陣的QR分解 chol2inv:由Choleski分解求逆 五、邏輯運算 <,>,<=,>=,==,!=:比較運算符 !,&,&&,|,||,xor():邏輯運算符 logical:生成邏輯向量 all,any:邏輯向量都為真或存在真
ifelse():二者擇一 match,%in%:查找 unique:找出互不相同的元素 which:找到真值下標集合 duplicated:找到重復元素 六、優(yōu)化及求根 optimize,uniroot,polyroot:一維優(yōu)化與求根 程序設計 一、控制結構 if,else,ifelse,switch:分支 for,while,repeat,break,next:循環(huán) apply,lapply,sapply,tapply,sweep:替代循環(huán)的函數(shù)。
二、函數(shù) function:函數(shù)定義 source:調用文件 call:函數(shù)調用 .C,.Fortran:調用C或者Fortran子程序的動態(tài)鏈接庫。 Recall:遞歸調用
browser,debug,trace,traceback:程序調試 options:指定系統(tǒng)參數(shù) missing:判斷虛參是否有對應實參 nargs:參數(shù)個數(shù) stop:終止函數(shù)執(zhí)行
on.exit:指定退出時執(zhí)行 eval,expression:表達式計算 system.time:表達式計算計時 invisible:使變量不顯示 menu:選擇菜單(字符列表菜單) 其它與函數(shù)有關的還有:delay,delete.response,deparse,do.call,dput,environment ,,formals,format.info,interactive,
is.finite,is.function,is.language,is.recursive ,match.arg,match.call,match.fun,model.extract,name,parse,substitute,sys.parent ,warning,machine 三、輸入輸出 cat,print:顯示對象 sink:輸出轉向到指定文件 dump,save,dput,write:輸出對象 scan,read.table,load,dget:讀入 四、工作環(huán)境 ls,objects:顯示對象列表 rm, remove:刪除對象 q,quit:退出系統(tǒng) .First,.Last:初始運行函數(shù)與退出運行函數(shù)。
options:系統(tǒng)選項 ?,help,help.start,apropos:幫助功能 data:列出數(shù)據(jù)集 統(tǒng)計計算 一、統(tǒng)計分布 每一種分布有四個函數(shù):d――density(密度函數(shù)),p――分布函數(shù),q――分位數(shù)函數(shù),r――隨機數(shù)函數(shù)。
比如,正態(tài)分布的這四個函數(shù)為dnorm,pnorm,qnorm,rnorm。下面我們列出各分布后綴,前面加前綴d、p、q或r就構成函數(shù)名: norm:正態(tài),t:t分布,f:F分布,chisq:卡方(包括非中心) unif:均勻,exp:指數(shù),weibull:威布爾,gamma:伽瑪,beta:貝塔
lnorm:對數(shù)正態(tài),logis:邏輯分布,cauchy:柯西, binom:二項分布,geom:幾何分布,hyper:超幾何,nbinom:負二項,pois:泊松 signrank:符號秩,
wilcox:秩和,tukey:學生化極差 二、簡單統(tǒng)計量 sum, mean, var, sd, min, max, range, median, IQR(四分位間距)等為統(tǒng)計量,sort,order,rank與排序有關,其它還有ave,fivenum,mad,quantile,stem等。 三、統(tǒng)計檢驗 R中已實現(xiàn)的有chisq.test,prop.test,t.test。 四、多元分析 cor,cov.wt,var:協(xié)方差陣及相關陣計算 biplot,biplot.princomp:多元數(shù)據(jù)biplot圖 cancor:典則相關 princomp:主成分分析 hclust:譜系聚類
kmeans:k-均值聚類 cmdscale:經典多維標度 其它有dist,mahalanobis,cov.rob。 五、時間序列 ts:時間序列對象 diff:計算差分 time:時間序列的采樣時間 window:時間窗 六、統(tǒng)計模型 lm,glm,aov:線性模型、廣義線性模型、方差分析
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03