淺析Python 多行匹配模式
問(wèn)題
你正在試著使用正則表達(dá)式去匹配一大塊的文本,而你需要跨越多行去匹配。
解決方案
這個(gè)問(wèn)題很典型的出現(xiàn)在當(dāng)你用點(diǎn)(.)去匹配任意字符的時(shí)候,忘記了點(diǎn)(.)不能匹配換行符的事實(shí)。比如,假設(shè)你想試著去匹配C語(yǔ)言分割的注釋:
>>> comment = re.compile(r’/*(.*?)*/’)>>> text1 = ’/* this is a comment */’>>> text2 = ’’’/* this is a... multiline comment */... ’’’>>>>>> comment.findall(text1)[’ this is a comment ’]>>> comment.findall(text2)[]>>>
為了修正這個(gè)問(wèn)題,你可以修改模式字符串,增加對(duì)換行的支持。比如:
>>> comment = re.compile(r’/*((?:.|n)*?)*/’)>>> comment.findall(text2)[’ this is an multiline comment ’]>>>
在這個(gè)模式中,(?:.|n) 指定了一個(gè)非捕獲組(也就是它定義了一個(gè)僅僅用來(lái)做匹配,而不能通過(guò)單獨(dú)捕獲或者編號(hào)的組)。
討論
re.compile() 函數(shù)接受一個(gè)標(biāo)志參數(shù)叫 re.DOTALL ,在這里非常有用。它可以讓正則表達(dá)式中的.匹配包括換行符在內(nèi)的任意字符。比如:
>>> comment = re.compile(r’/*(.*?)*/’, re.DOTALL)>>> comment.findall(text2)[’ this is an multiline comment ’]
對(duì)于簡(jiǎn)單的情況使用 re.DOTALL 標(biāo)記參數(shù)工作的很好,但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個(gè)模式合并起來(lái)(2.18節(jié)有詳細(xì)描述),這時(shí)候使用這個(gè)標(biāo)記參數(shù)就可能出現(xiàn)一些問(wèn)題。如果讓你選擇的話,最好還是定義自己的正則表達(dá)式模式,這樣它可以在不需要額外的標(biāo)記參數(shù)下也能工作的很好。
以上就是淺析Python 多行匹配模式的詳細(xì)內(nèi)容,更多關(guān)于Python 多行匹配模式的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. php測(cè)試程序運(yùn)行速度和頁(yè)面執(zhí)行速度的代碼2. ASP中常用的22個(gè)FSO文件操作函數(shù)整理3. 三個(gè)不常見(jiàn)的 HTML5 實(shí)用新特性簡(jiǎn)介4. Warning: require(): open_basedir restriction in effect,目錄配置open_basedir報(bào)錯(cuò)問(wèn)題分析5. ASP調(diào)用WebService轉(zhuǎn)化成JSON數(shù)據(jù),附j(luò)son.min.asp6. SharePoint Server 2019新特性介紹7. React+umi+typeScript創(chuàng)建項(xiàng)目的過(guò)程8. 無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁(yè)9. ASP.NET Core 5.0中的Host.CreateDefaultBuilder執(zhí)行過(guò)程解析10. php網(wǎng)絡(luò)安全中命令執(zhí)行漏洞的產(chǎn)生及本質(zhì)探究
