2021-03-02
閱讀量:
1008
如何利用正則表達(dá)式提取文中特定內(nèi)容呢?
函數(shù)介紹:
1.re.compile():該函數(shù)用于生成一個正則表達(dá)式,也就是匹配的核心部分,用來定義你需要怎么匹配,匹配什么內(nèi)容,更多細(xì)節(jié)可以去參看菜鳥教程。
2.re.findall():該函數(shù)用于在指定的字符串中進(jìn)行匹配。
提取特定內(nèi)容:
1.在一段文本或字符串中提取從某一位置XXX開始到某一位置X結(jié)束的特定內(nèi)容:re.compile('XXX.+X'),示例:
import re str='abcd1234efg' pattern=re.compile('ab.+ef') #匹配從ab開始,到ef結(jié)束的內(nèi)容 result=pattern.findall(str) print(result)
運(yùn)行結(jié)果如下
['abcd1234ef']
2.在一段文本或字符串中提取從某一位置XXX之后到某一位置X之前的特定內(nèi)容:re.compile('XXX(.+)X')
import re str='abcd1234efg' pattern=re.compile('ab(.+)ef') #匹配ab與ef之間的內(nèi)容 result=pattern.findall(str) print(result)
運(yùn)行結(jié)果如下
['cd1234']
所以從這兩個匹配可以看出,兩者的主要區(qū)別就在于有無(),很實用的一種方法~~






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論
0條評論