文章詳情頁

Python中re模塊的常用方法總結

瀏覽：41日期：2022-06-23 09:05:17

前言

正則表達式作為計算機科學的一個概念，通常被用來檢索、替換那些符合某個規(guī)則的文本。正則表達式是對字符串操作的一種邏輯公式，用事先定義好的規(guī)則字符串對字符串進行過濾邏輯處理。

re模塊總結，正則表達式。在網絡爬蟲中對于數據定位，學習regex也很有必要

常用方法 re.compile() 將指定的正則表達式模式編譯為正則表達式對象，可用于匹配和搜索 re.match() 該方法用于匹配字符串開頭的模式 re.serach() 該方法用于匹配出現在字符串中任意位置的模式 re.findall() 該方法返回字符串中制定正則表達式模式的所有非重疊匹配項 re.finditer() 對于從左到右掃描字符串中的特定模式，該方法以迭代器的形式返回所有匹配的實例 re.sub() 用于以替換串來替代字符串中特定的模式，他僅僅替換字符串中最左側出現的模式重要標識符

正則表達式可以包含一些可選標志修飾符來控制匹配的模式。修飾符被指定為一個可選的標志。多個標志可以通過按位 OR(|) 它們來指定。如 re.I | re.M 被設置成 I 和 M 標志：

Python中re模塊的常用方法總結

常用表達式規(guī)則

Python中re模塊的常用方法總結

舉例說明

下面的代碼描述了其中一些方法，并展示了在處理字符串和正則表達式通常如何使用他們

import repattern = 'python's1 = 'Python is an excellent language's2 = 'I love Python language.I also use Python to build applicants at work!'

re.match(pattern, string, flags=0)

從起始位置開始根據模型去字符串中匹配指定內容，匹配單個

re.match(pattern,s1)

因為大小寫，無法匹配成功

re.I 或 re.IGNORECASE 用于匹配不區(qū)分大小寫的模式

re.match(pattern,s1,re.I)

<re.Match object; span=(0, 6), match=’Python’>

re.match(pattern,s1,re.IGNORECASE)

<re.Match object; span=(0, 6), match=’Python’>

re.search(pattern, string, flags=0)

根據模型去字符串中匹配指定內容，匹配單個

現在來看下find()和search()方法在正則表達式是如何工作的

re.search(pattern,s2,re.IGNORECASE)

<re.Match object; span=(7, 13), match=’Python’>

re.findall(pattern, string, flags=0)

match and search均用于匹配單值，即：只能匹配字符串中的一個，如果想要匹配到字符串中所有符合條件的元素，則需要使用 findall。

re.findall(pattern,s2,re.IGNORECASE)

[’Python’, ’Python’]

re.sub(pattern, repl, string, count=0, flags=0)

用于文本替換的正則表達式對于查找和替換字符串中的特定文本標識符很有用

用于替換匹配的字符串,比str.replace功能更加強大

re.sub(pattern,'Java',s2,flags=re.I)

’I love Java language.I also use Java to build applicants at work!’

re.subn(pattern,'Java',s2,flags=re.I)

(’I love Java language.I also use Java to build applicants at work!’, 2)

re.split(pattern, string, maxsplit=0, flags=0)

用匹配到的值做為分割點，把值分割成列表

’Python is an excellent language’

re.split(' ',s1)

[’Python’, ’is’, ’an’, ’excellent’, ’language’]

按數字分割

print(re.split('d+','https://blog.csdn.net/qq_45176548'))‘(?P…)’ 分組匹配

s = ’230701200104280028’print(re.search(’(?P<province>d{3})(?P<city>d{3})(?P<born_date>d{8})(?P<seq>d{4})’,s))print(re.search(’(?P<province>d{3})(?P<city>d{3})(?P<born_date>d{8})(?P<seq>d{4})’,s).groups())res = re.search(’(?P<province>d{3})(?P<city>d{3})(?P<born_date>d{8})(?P<seq>d{4})’,s)print(res.groupdict())

<re.Match object; span=(0, 18), match=’230701200104280028’>(’230’, ’701’, ’20010428’, ’0028’){’province’: ’230’, ’city’: ’701’, ’born_date’: ’20010428’, ’seq’: ’0028’}---

總結

到此這篇關于Python中re模塊常用方法的文章就介紹到這了,更多相關Python中re模塊方法內容請搜索好吧啦網以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

Python 編程

上一條：Python查找算法之分塊查找算法的實現下一條：Python實現學生管理系統的代碼(JSON模塊)

相關文章：

1. .Net加密神器Eazfuscator.NET?2023.2?最新版使用教程2. Java GZip 基于內存實現壓縮和解壓的方法3. jsp+servlet簡單實現上傳文件功能（保存目錄改進）4. Springboot 全局日期格式化處理的實現5. 利用CSS制作3D動畫6. Python+unittest+requests 接口自動化測試框架搭建教程7. Java鏈表元素查找實現原理實例解析8. 存儲于xml中需要的HTML轉義代碼9. SpringBoot+TestNG單元測試的實現10. 一款功能強大的markdown編輯器tui.editor使用示例詳解

排行榜

					
					PHP利用COM對象訪問SQLServer、Access
Docker容器如何更新打包并上傳到阿里云
.Net加密神器Eazfuscator.NET?2023.2?最新版使用教程
Java鏈表元素查找實現原理實例解析
利用CSS制作3D動畫
jsp+servlet簡單實現上傳文件功能（保存目錄改進）
存儲于xml中需要的HTML轉義代碼
IntelliJ IDEA設置默認瀏覽器的方法
VMware中如何安裝Ubuntu
使用idea 去除 html 代碼前的行號和空行的方法詳解
Java GZip 基于內存實現壓縮和解壓的方法