正则表达式学习经验分析第1/2页

nbsp;         ASCII 数字 [0-9]
Alnum                 ASCII 字母或数字[A-Za-z0-9]
Xdigit                 十六进制数字[0-9A-Fa-f]
Print or Graph       可打印的ASCII字符[\x21-\x7E]
Punct                 非字母或数字ASCII [\p{Print}&&\P{Alnum}]
ASCII                 所有ASCII字符 [\x00-\x7F]
Cntrl                 ASCII控制字符[\x00-\x1F]
Blank                 空格符或制表符[ \t]
Space                 空白符 [ \t\n\r\f\0x0B]
javaLowerCase     取决于Character.isLowerCase()的小写字符
javaUpperCase     取决于Character.isUpperCase()的大写字符
javaWhitespace   取决于Character.isWhitespace()的空白符
javaMirrored         取决于Character.isMirrored()的Mirrored（？）
InBlock               这里的Block是unicode字符的块名，用空格隔开，比如BasicLatin 或 Mongolian。块名列表                       参考http://www.unicode.org
Category 或InCategory   这里的Category是Unicode字符的种类名，比如L（字母）或者Sc（货币符号）。种类                           名列表参考http://www.unicode.org

--------------------------------------------------------------------------------

  matcher的输入可以是实现CharSequence接口的任何类对象，像String，StringBuilder或CharBuffer。

  当编译模式时，可以设置一个或多个标志，例如

Pattern pattern = Pattern.compile(patternString,

Pattern.CASE_INSENSITIVE + Pattern.UNICODE_CASE);

下面六个标志都是支持的：

CASE_INSENSITIVE：匹配字符时与大小写无关，该标志默认只考虑US ASCII字符。

UNICODE_CASE：当与CASE_INSENSITIVE结合时，使用Unicode字母匹配

MULTILINE：^和$匹配一行的开始和结尾，而不是整个输入

UNIX_LINES：当在多行模式下匹配^和$时，只将''\n''看作行终止符

DOTALL: 当使用此标志时，.符号匹配包括行终止符在内的所有字符

CANON_EQ: 考虑Unicode字符的规范等价

  如果正则表达式包含分组，Matcher对象能够揭示分组边

正则表达式学习经验分析第1/2页

相关资讯

相关文章

相关专题

网学推荐

原创论文

文章排行榜