
R語言:基本函數(shù)、統(tǒng)計量、常用操作函數(shù)
先言:R語言常用界面操作
幫助:help(nnet) = ?nnet =??nnet
清除命令框中所有顯示內(nèi)容:Ctrl+L
清除R空間中內(nèi)存變量:rm(list=ls())、gc()
獲取或者設(shè)置當(dāng)前工作目錄:getwd、setwd
保存指定文件或者從磁盤中讀取出來:save、load
讀入、讀出文件:read.table、wirte.table、read.csv、write.csv
1、一些簡單的基本統(tǒng)計量
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#基本統(tǒng)計量
sum/mean/sd/min #一些基本統(tǒng)計量
which.min() #找出最小值的序號
以上是單數(shù)列,如果是多變量下的呢?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#多元數(shù)據(jù)
colMeans() #每列,row是行(橫向)
colnames() #列名
colSums() #列求和
cov() #協(xié)方差陣
cor() #相關(guān)矩陣
cor.test() #相關(guān)系數(shù)
abs 絕對值
sqrt 平方根
exp e^x次方
log 自然對數(shù)
log2,log10 其他對數(shù)
sin,cos,tan 三角函數(shù)
sinh,cosh,tanh 雙曲函數(shù)
poly 正交多項式
polyroot 多項式求根
對象操作:
assign 賦值操作,等同于“<-”
rm 刪除對象
ls 顯示內(nèi)存中的對象
str 顯示對象的內(nèi)在屬性或簡要說明對象
ls.str 展示內(nèi)存中所有對象的詳細(xì)信息
length 返回對象中元素的個數(shù)
names 顯示數(shù)據(jù)的名稱,對于數(shù)據(jù)框則是列名字
levels 因子向量的水平
dim 數(shù)據(jù)的維度
nrow 矩陣或數(shù)據(jù)框的行數(shù)
ncol 列數(shù)
rownames 數(shù)據(jù)的行名字
colnames 列名字
class 數(shù)據(jù)類型
mode 數(shù)據(jù)模式
head 數(shù)據(jù)的前n行
tail 數(shù)據(jù)的后n行
summary 顯示對象的概要
attr x的屬性類型
is.na 檢測變量的類型
is.null
is.array
is.data.frame
is.numeric
is.complex
is.character
簡單統(tǒng)計:
max 最大元素
min 最小元素
range 最小值和最大值組成的向量
sum 和
prod 元素連乘
pmax 向量間相同下標(biāo)進行比較最大者,并組成新的向量
pmin 向量間相同下標(biāo)進行比較最小者,并組成新的向量
cumsum 累積求和
cumprod 連乘
cummax 最大
cummin 最小
mean 均值
weighted,mean 加權(quán)平均數(shù)
median 中位數(shù)
sd 標(biāo)準(zhǔn)差
norm 正態(tài)分布
f F分布
unif 均勻分布
cauchy 柯西分布
binom 二項分布
geom 幾何分布
chisq.test 卡方檢驗,進行獨立性檢驗
prop.test 對總體均值進行假設(shè)檢驗
shapiro.test 正態(tài)分布檢驗
t.test T檢驗,對總體均值進行區(qū)間估計
aov 方差分析
anova 一個或多個模型對象的方差分析
2、向量
向量在循環(huán)語句中較為廣泛
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#向量
#向量在循環(huán)語句中較為廣泛
M=vector(length = 8);M #生成一個長為8的布爾向量
M[1]="1";M #賦值之后就會定義為字符
M[1]=1;M #賦值之后,定義為數(shù)值
邏輯向量使用
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
y[y < 0] <- -y[y < 0] #表示將向量(-y)中 與向量y的負(fù)元素對應(yīng)位置的元素 賦值給 向量y中 與向量y負(fù)元素對應(yīng)的元素。作用相當(dāng)于: y <- abs(y)
3、數(shù)據(jù)儲存形式
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#數(shù)據(jù)儲存形式
data.frame(wi=iris,ci=cars) #數(shù)據(jù)框形式,可以直接定義變量名
list(wi=iris,ci=cars) #list,也可以直接定義變量名
注意:attach()、detach()
可以將數(shù)據(jù)框中的變量釋放到Rs內(nèi)存中,然后就可以直接調(diào)用。
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
attach(iris)
names(setosa)
detach(iris)
在data.frame中,是可以實現(xiàn)數(shù)據(jù)集重命名的,比如data.frame(x=iris,y=cars),
也可以實現(xiàn)橫向、縱向重命名,data.frame(x=iris,y=cars,row.names=iris)
4、數(shù)據(jù)查看函數(shù)——names、str、unique組合、typeof()、mode()、class()
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##數(shù)據(jù)查看函數(shù)
names(iris) #查看所有變量名字
str(iris) #變量屬性(int整數(shù),num數(shù)值)
unique(iris$setosa) #查看分類變量的水平
table(iris$setosa) #分類水平,不同水平的個數(shù)(=unique+sum功能)
summary(iris) #所有變量各自的均值、分位數(shù)、眾數(shù)、最大、最小值等統(tǒng)計量,在回歸中就是系數(shù)表等
attributes(iris) #包括names(變量名)、row.names(序號的名稱)、class(數(shù)據(jù)形式)
一般names、str、unique會組合使用。
如何查看數(shù)據(jù)類型——typeof()、mode()、class()的區(qū)別?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
我這里用個因子例子來說明,希望能講清楚
> gl(2,5) #新建一個因子
[1] 1 1 1 1 1 2 2 2 2 2
Levels: 1 2
> class(gl(2,5)) #查看變量的類,顯示為因子;
[1] "factor"
> mode(gl(2,5)) #查看數(shù)據(jù)大類,顯示為數(shù)值型;
[1] "numeric"
> typeof(gl(2,5)) #查看數(shù)據(jù)細(xì)類,顯示為整數(shù)型;
[1] "integer"
#來自:http://f.dataguru.cn/thread-99785-1-1.html
從精細(xì)度上說,typeof>mode>class.
5、矩陣的基本知識與注意
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#矩陣的基本知識
t() #轉(zhuǎn)置
det() #行列式,方陣
x%*%y #向量內(nèi)積
x%o%y#向量外積
A=array(1:9,dim=c(3,3))
A*A #這個代表矩陣內(nèi)兩兩子元素相乘
A%*%A #才是我們想要的結(jié)果
crossprod(A,A) #等于t(A)%*%A
crossprod(t(A),A) #等于A%*%A,所以需要t(A)一下
t 矩陣轉(zhuǎn)置
rowsum 行求和
colsum 列求和
rowmeans 行平均
colmeans 列平均
solve 對線性方程求解或求矩陣的逆
diag 對角陣
6、因子
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##因子(≈文本+數(shù)字的組合)
#SPSS中值標(biāo)簽定義有異曲同工之妙
M=factor(iris$setosa,levels=c(1,0),labels=c("M","F"));M #能夠轉(zhuǎn)化因子格式+定義值標(biāo)簽
M=as.factor(iris$setosa);M #上面的函數(shù)更有效,因為as.factor只能轉(zhuǎn)化成因子格式
7、輸入輸出
library 加載包
data 加載制定數(shù)據(jù)集
load 加載save或者save.image保存的數(shù)據(jù)
read.table 讀取表格
read.csv 讀取以逗號分割的表格
read.delim 讀取以tab分割個表格
read.fwf 以fixed width formatted 形式讀取數(shù)據(jù)至表格
save 二進制保存指定對象
save.image 二進制保存當(dāng)前線程內(nèi)所有對象
write.table 將數(shù)據(jù)以表格形式寫入文本
write.csv 將數(shù)據(jù)以CSV表格形式寫入文本
cat 強制轉(zhuǎn)化為字符后輸出
sink 輸出轉(zhuǎn)向到指定文件
print 輸出屏幕
format 格式化
8、邏輯運算
!x 邏輯非
x & y 邏輯與
x && y 邏輯與(僅匹配并返回第一個值)
x | y 邏輯或
x || y 邏輯或(僅返回第一個值)
x or (x,y) 異或
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03