主頁 > 知識庫 > Python常用的正則表達式處理函數(shù)詳解

Python常用的正則表達式處理函數(shù)詳解

熱門標簽:ai電話機器人搭建 西藏智能外呼系統(tǒng)代理商 400電話辦理電話辦理 貴港公司如何申請400電話 梅縣地圖標注 地圖標注教學(xué)點 甘肅醫(yī)療外呼系統(tǒng)排名 外呼系統(tǒng)無呼出路由是什么原因 呼叫系統(tǒng)外呼只能兩次

正則表達式是一個特殊的字符序列,用于簡潔表達一組字符串特征,檢查一個字符串是否與某種模式匹配,使用起來十分方便。

在Python中,我們通過調(diào)用re庫來使用re模塊:

import re

正則表達式語法模式和操作符詳見:https://www.runoob.com/python/python-reg-expressions.html#flags

下面介紹Python常用的正則表達式處理函數(shù)。

re.match函數(shù)

re.match 函數(shù)從字符串的起始位置匹配正則表達式,返回match對象,如果不是起始位置匹配成功的話,match()就返回None。

re.match(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。具體參數(shù)為:

re.I:忽略大小寫。

re.L:表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當(dāng)前環(huán)境。

re.M:多行模式。

re.S:即 . ,并且包括換行符在內(nèi)的任意字符(. 不包括換行符)。

re.U:表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數(shù)據(jù)庫。

re.X:為了增加可讀性,忽略空格和 # 后面的注釋。

import re
#從起始位置匹配
r1=re.match('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.match('def','abcdefghi')
print(r2)

運行結(jié)果:

其中,span表示匹配成功的整個子串的索引。

使用group(num) 或 groups() 匹配對象函數(shù)來獲取匹配表達式。

group(num):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應(yīng)值的元組。

groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。

import re

s='This is a demo'
r1=re.match(r'(.*) is (.*)',s)
r2=re.match(r'(.*) is (.*?)',s)

print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運行結(jié)果:

上述代碼中的(.*)和(.*?)表示正則表達式的貪婪匹配與非貪婪匹配,詳情見此:https://www.jb51.net/article/31491.htm

re.search函數(shù)

re.search函數(shù)掃描整個字符串并返回第一個成功的匹配,如果匹配成功則返回match對象,否則返回None。

re.search(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。

import re
#從起始位置匹配
r1=re.search('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.search('def','abcdefghi')
print(r2)

運行結(jié)果:

使用group(num) 或 groups() 匹配對象函數(shù)來獲取匹配表達式。

group(num=0):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應(yīng)值的元組。

groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。

import re

s='This is a demo'
r1=re.search(r'(.*) is (.*)',s)
r2=re.search(r'(.*) is (.*?)',s)

print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運行結(jié)果:


從上面不難發(fā)現(xiàn)re.match與re.search的區(qū)別:re.match只匹配字符串的起始位置,只要起始位置不符合正則表達式就匹配失敗,而re.search是匹配整個字符串,直到找到一個匹配為止。

re.compile 函數(shù)

compile 函數(shù)用于編譯正則表達式,生成一個正則表達式對象,供 match() 和 search() 這兩個函數(shù)使用。

re.compile(pattern[, flags])

pattern:一個字符串形式的正則表達式。

flags:可選,表示匹配模式,比如忽略大小寫,多行模式等。

import re
#匹配數(shù)字
r=re.compile(r'\d+') 
r1=r.match('This is a demo')
r2=r.match('This is 111 and That is 222',0,27)
r3=r.match('This is 111 and That is 222',8,27)
 
print(r1)
print(r2)
print(r3)

運行結(jié)果:

findall函數(shù)

搜索字符串,以列表形式返回正則表達式匹配的所有子串,如果沒有找到匹配的,則返回空列表。

需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。

findall(string[, pos[, endpos]])

string:待匹配的字符串。

pos:可選參數(shù),指定字符串的起始位置,默認為0。

endpos:可選參數(shù),指定字符串的結(jié)束位置,默認為字符串的長度。

import re
#匹配數(shù)字
r=re.compile(r'\d+') 
r1=r.findall('This is a demo')
r2=r.findall('This is 111 and That is 222',0,11)
r3=r.findall('This is 111 and That is 222',0,27)
 
print(r1)
print(r2)
print(r3)

運行結(jié)果:

re.finditer函數(shù)

和 findall 類似,在字符串中找到正則表達式所匹配的所有子串,并把它們作為一個迭代器返回。

re.finditer(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如是否區(qū)分大小寫,多行匹配等。

import re 

r=re.finditer(r'\d+','This is 111 and That is 222')
for i in r: 
 print (i.group())

運行結(jié)果:

re.split函數(shù)

將一個字符串按照正則表達式匹配的子串進行分割后,以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern:匹配的正則表達式。

string:待匹配的字符串。

maxsplit:分割次數(shù),maxsplit=1分割一次,默認為0,不限次數(shù)。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區(qū)分大小寫,多行匹配等。

import re 

r1=re.split('\W+','This is 111 and That is 222') 
r2=re.split('\W+','This is 111 and That is 222',maxsplit=1) 
r3=re.split('\d+','This is 111 and That is 222') 
r4=re.split('\d+','This is 111 and That is 222',maxsplit=1) 
print(r1)
print(r2)
print(r3)
print(r4)

運行結(jié)果:

re.sub函數(shù)

re.sub函數(shù)用于替換字符串中的匹配項。

re.sub(pattern, repl, string, count=0, flags=0)

pattern:正則中的模式字符串。

repl:替換的字符串,也可為一個函數(shù)。

string:要被查找替換的原始字符串。

count:模式匹配后替換的最大次數(shù),默認0表示替換所有的匹配。

import re 

r='This is 111 and That is 222'
# 刪除字符串中的數(shù)字
r1=re.sub(r'\d+','',r)
print(r1)
# 刪除非數(shù)字的字符串 
r2=re.sub(r'\D','',r)
print(r2)

運行結(jié)果:

參考資料:

https://www.runoob.com/python/python-reg-expressions.html#flags

到此這篇關(guān)于Python常用的正則表達式處理函數(shù)詳解的文章就介紹到這了,更多相關(guān)python 正則表達式處理函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 一文秒懂python正則表達式常用函數(shù)
  • Python編程快速上手——strip()函數(shù)的正則表達式實現(xiàn)方法分析
  • 關(guān)于Python正則表達式 findall函數(shù)問題詳解
  • python使用正則表達式的search()函數(shù)實現(xiàn)指定位置搜索功能
  • python正則表達式re之compile函數(shù)解析
  • Python正則表達式常用函數(shù)總結(jié)
  • Python中正則表達式match()、search()函數(shù)及match()和search()的區(qū)別詳解

標簽:大興安嶺 本溪 哈密 常州 涼山 湖州 泰安

巨人網(wǎng)絡(luò)通訊聲明:本文標題《Python常用的正則表達式處理函數(shù)詳解》,本文關(guān)鍵詞  Python,常用的,常,用的,正則,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python常用的正則表達式處理函數(shù)詳解》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python常用的正則表達式處理函數(shù)詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章