
R語言:基本函數(shù)、統(tǒng)計(jì)量、常用操作函數(shù)
先言:R語言常用界面操作
幫助:help(nnet) = ?nnet =??nnet
清除命令框中所有顯示內(nèi)容:Ctrl+L
清除R空間中內(nèi)存變量:rm(list=ls())、gc()
獲取或者設(shè)置當(dāng)前工作目錄:getwd、setwd
保存指定文件或者從磁盤中讀取出來:save、load
讀入、讀出文件:read.table、wirte.table、read.csv、write.csv
1、一些簡單的基本統(tǒng)計(jì)量
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#基本統(tǒng)計(jì)量
sum/mean/sd/min #一些基本統(tǒng)計(jì)量
which.min() #找出最小值的序號
以上是單數(shù)列,如果是多變量下的呢?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#多元數(shù)據(jù)
colMeans() #每列,row是行(橫向)
colnames() #列名
colSums() #列求和
cov() #協(xié)方差陣
cor() #相關(guān)矩陣
cor.test() #相關(guān)系數(shù)
abs 絕對值
sqrt 平方根
exp e^x次方
log 自然對數(shù)
log2,log10 其他對數(shù)
sin,cos,tan 三角函數(shù)
sinh,cosh,tanh 雙曲函數(shù)
poly 正交多項(xiàng)式
polyroot 多項(xiàng)式求根
對象操作:
assign 賦值操作,等同于“<-”
rm 刪除對象
ls 顯示內(nèi)存中的對象
str 顯示對象的內(nèi)在屬性或簡要說明對象
ls.str 展示內(nèi)存中所有對象的詳細(xì)信息
length 返回對象中元素的個(gè)數(shù)
names 顯示數(shù)據(jù)的名稱,對于數(shù)據(jù)框則是列名字
levels 因子向量的水平
dim 數(shù)據(jù)的維度
nrow 矩陣或數(shù)據(jù)框的行數(shù)
ncol 列數(shù)
rownames 數(shù)據(jù)的行名字
colnames 列名字
class 數(shù)據(jù)類型
mode 數(shù)據(jù)模式
head 數(shù)據(jù)的前n行
tail 數(shù)據(jù)的后n行
summary 顯示對象的概要
attr x的屬性類型
is.na 檢測變量的類型
is.null
is.array
is.data.frame
is.numeric
is.complex
is.character
簡單統(tǒng)計(jì):
max 最大元素
min 最小元素
range 最小值和最大值組成的向量
sum 和
prod 元素連乘
pmax 向量間相同下標(biāo)進(jìn)行比較最大者,并組成新的向量
pmin 向量間相同下標(biāo)進(jìn)行比較最小者,并組成新的向量
cumsum 累積求和
cumprod 連乘
cummax 最大
cummin 最小
mean 均值
weighted,mean 加權(quán)平均數(shù)
median 中位數(shù)
sd 標(biāo)準(zhǔn)差
norm 正態(tài)分布
f F分布
unif 均勻分布
cauchy 柯西分布
binom 二項(xiàng)分布
geom 幾何分布
chisq.test 卡方檢驗(yàn),進(jìn)行獨(dú)立性檢驗(yàn)
prop.test 對總體均值進(jìn)行假設(shè)檢驗(yàn)
shapiro.test 正態(tài)分布檢驗(yàn)
t.test T檢驗(yàn),對總體均值進(jìn)行區(qū)間估計(jì)
aov 方差分析
anova 一個(gè)或多個(gè)模型對象的方差分析
2、向量
向量在循環(huán)語句中較為廣泛
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#向量
#向量在循環(huán)語句中較為廣泛
M=vector(length = 8);M #生成一個(gè)長為8的布爾向量
M[1]="1";M #賦值之后就會(huì)定義為字符
M[1]=1;M #賦值之后,定義為數(shù)值
邏輯向量使用
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
y[y < 0] <- -y[y < 0] #表示將向量(-y)中 與向量y的負(fù)元素對應(yīng)位置的元素 賦值給 向量y中 與向量y負(fù)元素對應(yīng)的元素。作用相當(dāng)于: y <- abs(y)
3、數(shù)據(jù)儲(chǔ)存形式
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#數(shù)據(jù)儲(chǔ)存形式
data.frame(wi=iris,ci=cars) #數(shù)據(jù)框形式,可以直接定義變量名
list(wi=iris,ci=cars) #list,也可以直接定義變量名
注意:attach()、detach()
可以將數(shù)據(jù)框中的變量釋放到Rs內(nèi)存中,然后就可以直接調(diào)用。
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
attach(iris)
names(setosa)
detach(iris)
在data.frame中,是可以實(shí)現(xiàn)數(shù)據(jù)集重命名的,比如data.frame(x=iris,y=cars),
也可以實(shí)現(xiàn)橫向、縱向重命名,data.frame(x=iris,y=cars,row.names=iris)
4、數(shù)據(jù)查看函數(shù)——names、str、unique組合、typeof()、mode()、class()
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##數(shù)據(jù)查看函數(shù)
names(iris) #查看所有變量名字
str(iris) #變量屬性(int整數(shù),num數(shù)值)
unique(iris$setosa) #查看分類變量的水平
table(iris$setosa) #分類水平,不同水平的個(gè)數(shù)(=unique+sum功能)
summary(iris) #所有變量各自的均值、分位數(shù)、眾數(shù)、最大、最小值等統(tǒng)計(jì)量,在回歸中就是系數(shù)表等
attributes(iris) #包括names(變量名)、row.names(序號的名稱)、class(數(shù)據(jù)形式)
一般names、str、unique會(huì)組合使用。
如何查看數(shù)據(jù)類型——typeof()、mode()、class()的區(qū)別?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
我這里用個(gè)因子例子來說明,希望能講清楚
> gl(2,5) #新建一個(gè)因子
[1] 1 1 1 1 1 2 2 2 2 2
Levels: 1 2
> class(gl(2,5)) #查看變量的類,顯示為因子;
[1] "factor"
> mode(gl(2,5)) #查看數(shù)據(jù)大類,顯示為數(shù)值型;
[1] "numeric"
> typeof(gl(2,5)) #查看數(shù)據(jù)細(xì)類,顯示為整數(shù)型;
[1] "integer"
#來自:http://f.dataguru.cn/thread-99785-1-1.html
從精細(xì)度上說,typeof>mode>class.
5、矩陣的基本知識與注意
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#矩陣的基本知識
t() #轉(zhuǎn)置
det() #行列式,方陣
x%*%y #向量內(nèi)積
x%o%y#向量外積
A=array(1:9,dim=c(3,3))
A*A #這個(gè)代表矩陣內(nèi)兩兩子元素相乘
A%*%A #才是我們想要的結(jié)果
crossprod(A,A) #等于t(A)%*%A
crossprod(t(A),A) #等于A%*%A,所以需要t(A)一下
t 矩陣轉(zhuǎn)置
rowsum 行求和
colsum 列求和
rowmeans 行平均
colmeans 列平均
solve 對線性方程求解或求矩陣的逆
diag 對角陣
6、因子
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##因子(≈文本+數(shù)字的組合)
#SPSS中值標(biāo)簽定義有異曲同工之妙
M=factor(iris$setosa,levels=c(1,0),labels=c("M","F"));M #能夠轉(zhuǎn)化因子格式+定義值標(biāo)簽
M=as.factor(iris$setosa);M #上面的函數(shù)更有效,因?yàn)閍s.factor只能轉(zhuǎn)化成因子格式
7、輸入輸出
library 加載包
data 加載制定數(shù)據(jù)集
load 加載save或者save.image保存的數(shù)據(jù)
read.table 讀取表格
read.csv 讀取以逗號分割的表格
read.delim 讀取以tab分割個(gè)表格
read.fwf 以fixed width formatted 形式讀取數(shù)據(jù)至表格
save 二進(jìn)制保存指定對象
save.image 二進(jìn)制保存當(dāng)前線程內(nèi)所有對象
write.table 將數(shù)據(jù)以表格形式寫入文本
write.csv 將數(shù)據(jù)以CSV表格形式寫入文本
cat 強(qiáng)制轉(zhuǎn)化為字符后輸出
sink 輸出轉(zhuǎn)向到指定文件
print 輸出屏幕
format 格式化
8、邏輯運(yùn)算
!x 邏輯非
x & y 邏輯與
x && y 邏輯與(僅匹配并返回第一個(gè)值)
x | y 邏輯或
x || y 邏輯或(僅返回第一個(gè)值)
x or (x,y) 異或
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10