'; i <= ''*''; i++)
{
richTextBox2.Text += (char)i + "\n";
}
/*--------输出--------
#
$
%
&
''
(
)
*
*/
由于“#”和“*”符合要求,“[#-*]”可以表示一个字符范围,其中就包含了字符“$”,所以上面的正则是可以匹配“$”的,如果只是把“-”当作一个普通字符处理,那么要么换个位置,要么把“-”转义。
Regex reg1 = new Regex(@"[#*%&-]");
Regex reg2 = new Regex(@"[#\-*%&]");
这两种方式都表示匹配字符组中列举的字符中的任意一个。
在字符组中,还有一个比较特殊的转义字符,“\b”出现在正则表达式中一般位置时,表示单词边界,也就是一侧为组成单词的字符,另一侧不是;而当“\b”出现在字符组中时,表示的是退格符,与普通字符串中出现的“\b”意义是一样的。
同样的,还有一个容易被忽视,而且经常被忽视的转义符“|”,当“|”出现在正则表达式中一般位置时,表示左右两侧“或”的关系;而当“|”出现在字符组中时,它仅仅表示“|”字符本身,没有任何特殊意义,所以如果不是要匹配“|”本身,而试图在字符组中使用“|”时,是错误的。比如正则表达式“[a|b]”表示的是“a”、“b”、“|”中的任意一个,而不是“a”或“b”。
2.4 .NET正则应用中不可见字符转义处理
对于一些不可见字符,要在字符串中表示时,需要用转义字符,比较常见的有“\r”、“\n”、“\t”等等,而这些字符在正则中应用,就变得有些神奇了,先看一段代码。
复制代码 代码如下:
string test = "one line. \n another line.";
List<Regex> list = new List<Regex>();
list.Add(new Regex("\n"));
list.Add(new Regex("\\n"));
list.Add(new Regex(@"\n"));
list.Add(new Regex(@"\\n"));
foreach (Regex reg in list)
{
richTextBox2.Text += "正则表达式:" + reg.ToString();
MatchCollection mc = reg.Matches(test);
foreach (Match m in mc)
{
richTextBox2.Text += " 匹配内容:" + m.Value + " 匹配起始位置:" + m.Index + " 匹配长度:" + m.Length;
}
richTextBox2.Text += " 匹配总数:" + reg.Matches(test).Count + "\n----------------\n";
}
/*--------输出--------
正则表达式:
匹配内容:
匹配起始位置:10 匹配长度:1 匹配总数:1
----------------
正则表达式:\n 匹配内容:
匹配起始位置:10 匹配长度:1 匹配总数:1
----------------
正则表达式:\n 匹配内容:
匹配起始位置:10 匹配长度:1 匹配总数:1
----------------
正则表达式:\\n 匹配总数:0
----------------
*/
可以看到,前三种写法,输出的正则虽不同,但执行结果却是完全相同的,只有最后一种是没有匹配的。
正则表达式一Regex("\n"),其实就是以普通字符串形式来声明正则的,与用Regex("a")来匹配字符“a”是同样的道理,是不经过正则引擎转义的。
正则表达式二Regex("\\n"),是以正则表达式形式来声明正则的,正如正则中的“\\\\”就等同于字符串中的“\\”一样,正则中的“\\n”就等同于字符串中的“\n”,是经过正则引擎转义的。
正则表达式三Regex(@"\n"),与正则表达式二等价,是字符串前加“@”的写法。
正则表达式四Regex(@"\\n"),其实这个表示的是字符“\”后面跟一个字符“n”,是两个字符,这个在源字符串中自然是找不到匹配项的。
这里需要特别注意的还是“\b”,不同的声明方式,“\b”的意义是不同的。
复制代码 代码如下:
string test = "one line. \n another line.";
List<Regex> list = new List<Regex>();
list.Add(new Regex("line\b"));
list.Add(new Regex("line\\b"));
list.Add(new Regex(@"line\b"));
list.Add(new Regex(@"line\\b"));
foreach (Regex reg in list)