则都是这样,只要在合法的情况下,它们会尽量多去匹配字符,这就叫做贪心模式。
如果我们希望正则尽量少地匹配字符,那么就可以在表示数字的符号后面加上一个?。组成如下的形式:
{n,}?, *?, +?, ??, {m,n}?
同样来看一个例子:
复制代码 代码如下:
reg = /c{1,}?/;
str=''ccccc'';
execReg(reg,str);
返回的结果只有1个c,尽管有5个c可以匹配,但是由于正则表达式是非贪心模式,所以只会匹配一个。
/^开头,结尾$/
^表示只匹配字符串的开头。看下面的例子:
复制代码 代码如下:
reg = /^c/;
str=''维生素c'';
execReg(reg,str);
结果为null,因为字符串‘维生素c''的开头并不是c,所以匹配失败。
复制代码 代码如下:
reg = /^c/;
str=''cainiao'';
execReg(reg,str);
这次则返回c,匹配成功,因为cainiao恰恰是以c开头的。
与^相反,$则只匹配字符串结尾的字符,同样,看例子:
复制代码 代码如下:
reg = /c$/;
str=''cainiao'';
execReg(reg,str);
返回null,表示正则表达式没能在字符串的结尾找到c这个字符。
复制代码 代码如下:
reg = /c$/;
str=''维生素c'';
execReg(reg,str);
这次返回的结果是c,表明匹配成功。
点''.''
‘.''会匹配字符串中除了换行符\n之外的所有字符,例如
复制代码 代码如下:
reg = /./;
str=''cainiao'';
execReg(reg,str);
结果显示,正则匹配到了字符c。
复制代码 代码如下:
reg = /./;
str=''blueidea'';
execReg(reg,str);
这次是b。
复制代码 代码如下:
reg = /.+/;
str=''blueidea——经典论坛 好_。'';
execReg(reg,str);
结果是“blueidea——经典论坛 好_。“也就是说所有的字符都被匹配掉了,包括一个空格,一个下滑线,和一个破折号。
复制代码 代码如下:
reg = /.+/;
reg = /.+/;
str=''bbs.blueidea.com'';
execReg(reg,str);
同样,直接返回整个字符串——bbs.blueidea.com,可见”.”也匹配”.”本身。
复制代码 代码如下:
reg = /^./;
str=''\ncainiao'';
execReg(reg,str);
结果是null,终于失败了,正则要求字符串的第一个字符不是换行,但是恰恰字符是以\n开始的。
二选一,正则表达式中的或,“|“
b|c表示,匹配b或者c。
例如:
复制代码 代码如下:
reg = /b|c/;
str=''blueidea'';
execReg(reg,str);
结果是b。
复制代码 代码如下:
reg = /b|c/;
str=''cainiao'';
execReg(reg,str);
结果是c。
复制代码 代码如下:
reg = /^b|c.+/;
str=''cainiao'';
execReg(reg,str);
匹配掉整个cainiao。
复制代码 代码如下:
reg = /^b|c.+/;
str=''bbs.blueidea.com'';
execReg(reg,str);
结果只有一个b,而不是整个字符串。因为上面正则表达式的意思是,匹配开头的b或者是c.+。
括号
复制代码 代码如下:
reg = /^(b|c).+/;
str=''bbs.blueidea.com'';
execReg(reg,str);
这次的结果是整个串bbs.blueidea.com,机上上面的括号这后,这个正则的意思是,如果字符串的开头是b或者c,那么匹配开头的b或者c以及其后的所有的非换行字符。
如果你也实验了的话,会发现返回的结果后面多出来一个“,b“,这是()内的b|c所匹配的内容。我们在正则表达式内括号里写的内容会被认为是子正则表达式,所匹配的结果也会被记录下来供后面使用。我们暂且不去理会这个特性。
字符集合[abc]
[abc]表示a或者b或者c中的任意一个字符。例如:
复制代码 代码如下:
reg = /^[abc]/;
str=''bbs.blueidea.com'';
execReg(reg,str);
返回结果是b。
复制代码 代码如下:
reg = /^[abc]/;
str=''test'';
execReg(reg,str);
这次的结果就是null了。
我们在字字符集合中使用如下的表示方式:[a-z],[A-Z],[0-9],分别表示小写字母,大写字母,数字。例如:
复制代码 代码如下:
reg = /^[a-zA-Z][a-zA-Z0-9_]