re.match()方法怎么在python中使用

  介绍

re.match()方法怎么在python中使用?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

import 再保险=& # 39;行Cats 断开连接;smarter  than 狗# 39;   matchObj=re.match(" # 39;(. *)(* ?)。* & # 39;,线)      if  matchObj:   ,打印(& # 39;matchObj.group (): & # 39;, matchObj.group ())   ,打印(& # 39;matchObj.group (1): & # 39;,, matchObj.group (1))   ,打印(& # 39;matchObj.group (2): & # 39;,, matchObj.group (2))   其他:   ,打印(& # 39;No 比赛! \ n # 39;)

书上的期望输出是:

matchObj.group():猫比狗更聪明
matchObj.group(1):猫
matchObj.group(2):聪明

但是我在电脑上跑了一遍得到的输出却是:

matchObj.group():猫比狗更聪明
matchObj.group(1):猫
matchObj.group (2):

于是开始想办法彻底搞清楚这个差别的原因所在。

首先要读懂这几行代码,而这一行代码的关键在于这一句:

matchObj=re.match(" # 39;(. *)(* ?)。* & # 39;,线)

匹配的正则表达式是

(. *) (* ?)。*
前面的r表示的是匹配的字符不进行转义,而要匹配的字符串是线,也就是
猫比狗更聪明
后面使用集团(num)个人理解是,按照正则表达式中的括号数可以捕获得到对应数量的捕获组,而调用集团(num)就可以得到对应捕获组的内容,
其中组(0)表示的是匹配的整个表达式的字符串,在本例中就是“猫比狗更聪明# 39;。
参照网上可以搜到的符号的作用:
。匹配除换行符以外的任意字符
*重复之前的字符零次或更多次
?重复之前的字符零次或一次
那么第一个括号的内容,应当就是匹配要匹配的字符串中是之前的所有字符(除换行符),
而第二个括号的内容应当是匹配是之后的内容,但具体想指代什么却显得有些不明确。
不明确的点就在于*和?这两个符号的连用,根据优先级这两个符号是同一优先级的,那么应当按照顺序生效,那么如此翻译的话,这一语句匹配的就是长度为0到无限大的任意字符串,为了探清此时
程序判断的具体内容,我们给匹配字符串末尾的。*也加上括号以提取其内容,而后在输出部分加上对应语句:

import 再保险=& # 39;行Cats 断开连接;smarter  than 狗# 39;   matchObj=re.match(" # 39;(. *),(. * ?)(. *) & # 39;,线)      if  matchObj:   ,打印(“matchObj.group ():“, matchObj.group ())   ,打印(“matchObj.group (1):“,, matchObj.group (1))   ,打印(“matchObj.group (2):“,, matchObj.group (2))   ,打印(“matchObj.group (3):“,, matchObj.group (3))   其他:   ,打印(& # 39;No 比赛! \ n # 39;)

得到的结果是:

matchObj.group():猫比狗更聪明
matchObj.group(1):猫
matchObj.group (2):
matchObj.group (3):,比狗聪明

可见第二个括号里的内容被默认为空了,然后删去那个?,可以看到结果变成:

matchObj.group():猫比狗更聪明
matchObj.group(1):猫
matchObj.group (2):,比狗聪明
matchObj.group (3):

那么这是否就意味着?的默认值很可能是0次,那?这个符号到底有什么用呢

仔细想来这个说法并不是很严谨。尝试使用单独的。?组合可以看到这个组合可以用于提取

单个不知道是否存在的字符,而如下代码

import 再保险=& # 39;行Cats 断开连接;smarter  than 狗# 39;   matchObj=re.match(" # 39;(. *),(. *) ? & # 39;,线)      if  matchObj:   ,打印(“matchObj.group ():“, matchObj.group ())   ,打印(“matchObj.group (1):“,, matchObj.group (1))   ,打印(“matchObj.group (2):“,, matchObj.group (2)

也能在组2中别正常提取到是之后的字符内容,但稍微改动一下将?放到第二个括号内,

就什么也提取不到,同时导致集团(0)中匹配的字符到猫就截止了(也就是第二个括号匹配失败)。

令人感到奇怪的是,如果将上面的代码改成

import 再保险=& # 39;行Cats 断开连接;smarter  than 狗# 39;   matchObj=re.match(" # 39;(. *),断开连接,(. *)+ & # 39;,线)      if  matchObj:   ,打印(“matchObj.group ():“, matchObj.group ())   ,打印(“matchObj.group (1):“,, matchObj.group (1))   ,打印(“matchObj.group (2):“,, matchObj.group (2)

re.match()方法怎么在python中使用