2019-03-08
閱讀量:
1574
gsub / sub在某些字符之間提取
如何從R中的以下字符串中提取數(shù)字/ ID?
link <- "D:/temp/sample_data/0000098618-13-000011.htm"
我想提取 0000098618-13-000011
那是丟棄.htm和D:/temp/sample_data/。
我沒(méi)有太多運(yùn)氣試過(guò)grep和gsub。
解決辦法:使用basename后跟sub:
sub("\\..*", "", basename(link))
## [1] "0000098618-13-000011"
要么
library(tools)
file_path_sans_ext(link)
## [1] "0000098618-13-000011"
或者以更復(fù)雜的模式為代價(jià),我們可以在一個(gè)單獨(dú)的模式中完成sub:
sub(".*/(.*)\\..*", "\\1", link)
## [1] "0000098618-13-000011"
或單個(gè)gsub:
gsub(".*/|\\.[^.]*$", "", link)
## [1] "0000098618-13-000011"
或者strsplit:
sapply(strsplit(link, "[/.]"), function(x) tail(x, 2)[1])
## [1] "0000098618-13-000011"






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論