如何在Python中使用正则表达式实现查找和替换文本的操作

  介绍

这篇文章给大家介绍如何在Python中使用正则表达式实现查找和替换文本的操作,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

<强> 1,需求

我们想对字符串中的文本做查找和替换。

<强> 2,解决方案

对于简单的文本模式,使用str.replace()即可。

例如:

文本=& # 39;mark ,帅哥,18183年,帅,马克# 39;   打印(text.replace (& # 39; 18 & # 39; & # 39; 19 & # 39;))   打印(文本)

运行结果:

标记,帅哥,19193名帅,标记
标记,帅哥,18183名帅,马克

针对更为复杂的模式,可以使用re模块中的接头()函数。

实例:将日期格式从“11/28/2018改”为“2018-11-28”

import 再保险   文本=& # 39;今天是:11/28/2018& # 39;   打印(re.sub (" # 39; (\ d +)/(\ d +)/(\ d +) & # 39;, " # 39; \ 3 - 1 \ \ 2 & # 39;,文本))   打印(文本)

结果:

今天是:2018-11-28
今天是:11/28/2018

子()的第一个参数是要匹配的模式,第二个参数是要替换的模式。类似的“3”这样的反斜线加数字表示模式中捕获组的编号。

如果打算用相同的模式执行重复替换,可以考虑先将模式编译以获得更好的性能。

实例:

import 再保险   文本=& # 39;今天是:11/28/2018& # 39;   datepat=re.compile (" # 39; (\ d +)/(\ d +)/(\ d +) & # 39;)   打印(datepat.sub(" # 39; \ 3 - 1 \ \ 2 & # 39;,文本))   打印(文本)

结果:

今天是:2018-11-28
今天是:11/28/2018

对于更加复杂的情况,可以指定一个替换回调函数。

示例:

import 再保险   得到calendar  import  month_abbr   文本=& # 39;今天是:11/28/2018& # 39;   datepat=re.compile (" # 39; (\ d +)/(\ d +)/(\ d +) & # 39;)      def  change_date(米):   mon_name才能=month_abbr [int (m.group (1)))   return 才能;& # 39;{},{},{}& # 39;.format (m.group (3), mon_name, m.group (2))   print (datepat.sub (change_date、文本))   打印(文本)

结果:

今天是:2018年11月28日
今天是:11/28/2018

替换回调函数的输入参数是一个匹配对象,由匹配()和()找到返回。用.group()方法来提取匹配中特定的部分。该函数返回替换后的文本。

除了得到替换后的文本外,如果还想知道一共完成了多少次替换,可以使用re.subn ()。

示例:

import 再保险   文本=& # 39;今天是:11/28/2018,昨天是11/27/2018& # 39;   datepat=re.compile (" # 39; (\ d +)/(\ d +)/(\ d +) & # 39;)   new_text n=datepat.subn(" # 39; \ 3 - 1 \ \ 2 & # 39;,文本)   打印(文本)   打印(new_text)   打印(n)

结果:

今天是:11/28/2018,昨天是11/27/2018
今天是:2018-11-28,昨天是2018-11-27

如何在Python中使用正则表达式实现查找和替换文本的操作