为学校网站做网站推广策划书手游推广代理平台有哪些
在正则表达式中,?既可以表示数量,0次或1次,等效于 {0,1},也可以跟在其它数量限定符之后,表示非贪心匹配,即匹配时匹配搜索到的尽可能短的字符串。
下面来看一个例子:
@Test
public void test() {Pattern pattern = Pattern.compile("a.*?");Matcher matcher = pattern.matcher("abcabc");if (matcher.matches()) {System.out.println(matcher.group());}
}
执行后输出:abcabc
不是最短匹配吗?为什么失灵了?
这其实牵涉到非贪心匹配的规则:非贪心匹配,到下一个规则前,匹配最短路径,如果没有下一个规则,按贪心匹配处理。
也就是说如果只出现 "a.*?" 还是按贪心匹配处理。
下面来看正确的使用:
@Test
public void test() {Pattern pattern = Pattern.compile("(a.*?)(.*)");Matcher matcher = pattern.matcher("afcafc");if (matcher.matches()) {System.out.println(matcher.group(0));System.out.println(matcher.group(1));System.out.println(matcher.group(2));}
}
执行后输出:
afcafc
a
fcafc
可以看到,第一个捕获组捕获到了最短的字符串 "a",第二个捕获组捕获到了 "fcafc"。
下面再来看看另外两种情况:
- "(a.*)(.*)" 第一个捕获组会捕获所有,第二个不会报错,但什么也捕获不到
- "(a.*?)(.*?)" 第一个捕获组会捕获 "a",第二个捕获组会捕获 "fcafc",因为后面没有其它规则了,按贪心匹配处理。