正则表达式中常用符号
符号含义举例或说明
.任何字符或非字符 2.4匹配204, 214, 2t4, 2 4, 2.4, 2-4
*重复0次或更多BA*匹配B,BA,BAA,BAAA等
.* 某个字符重复0次或更多R.* 表示R后面有0个过多个字符,不同类副词
的赋码包括RR,RG,PGQ,RGQV等, 所以R.*表示,
不分类笼统地指所有副词, 类似的所有名词
N.*,所有形容词J.*
+重复1次或多次A+匹配A,AA,AAA等
?有或者无BA?匹配B和BA
.*?任何字符串
|或者(|号在回车键上面)(analyze|analyse) 检索analyse 或者
analyze
[ ] 方括号中的任意字符或单词[abc]匹配a、b或c
[abc]+匹配
[ ]* n个单词。
() 组合,使得括号中的部分可以当作
一个符号处理
act(ing)可以匹配act和acting
(cat|dog),把dog 和cat 两个词一块检索出来,
([pos="R.*"][pos="J.*"]) 前面一个词的词性为副词,
后面一个词的词性为形容词,把副词和形容词作
为一个整体检索
{} { }表示选择范围,{0,3}表示0~3个
范围内[pos="J.*"]{0,2} 表示其前的形容词有0个,1个或者2个
[ ] {0,}中,[ ]表示任意单词,{0,2}表示这个单词有0个,1个,或者无穷个,后面一个数字不写表示无穷个。
& 和,并且
<s> </s> <s>段首标记,
</s段尾>
<s> “however|However”表示句首为However或
however 开头的句子
!不等于[word!=","] "which"表示which 前没有逗号
[pos!="JJ.*|N.*|I.*"] 词性不是形容词、名词、介词
的词
N.*名词、V.* 动词、J.*形容词、R.* 副词、AT.* 冠词、I.* 介词、P.*代词
VB.*表示be动词、VH*有动词、VV.*实意动词及其各种变形、VM*情态动词。