当前位置:文档之家› Delphi 正则表达式

Delphi 正则表达式

Delphi 正则表达式语法(1): 关于大小写与中文//替换一般字符串varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '我爱DELPHI, 但Delphi不爱我!';reg.RegEx := 'Delphi';reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: 我爱DELPHI, 但◆不爱我!FreeAndNil(reg);end;//不区分大小写varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '我爱DELPHI, 但Delphi不爱我!';reg.RegEx := 'Delphi';reg.Replacement := '◆';reg.Options := [preCaseLess]; //不区分大小的设定, 默认是区分的reg.ReplaceAll;ShowMessage(reg.Subject); //返回: 我爱◆, 但◆不爱我!FreeAndNil(reg);reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆DELPHI, ◆Delphi◆◆◆!FreeAndNil(reg);end;//我测试了不同的汉字, 除了乱以外,没有规律; 所有如果操作汉字暂时不要指定 preCaseLessDelphi 正则表达式语法(2): 或者与重复// | 号的使用, | 是或者的意思varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007';reg.RegEx := 'e|Delphi|0'; //使用了 | 记号reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: Cod◆G◆ar ◆ 2◆◆7FreeAndNil(reg);end;// + 的使用, + 是重复 1 个或多个varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'a aa aaa aaaa ab abb abbba a呀a';reg.RegEx := 'a?';//使用了 ? 记号reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆◆◆◆◆◆◆◆◆b ◆bb ◆bbb◆◆呀◆FreeAndNil(reg);end;//大括号的使用<1>, 指定重复数varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'a aa aaa aaaa ab abb abbba a呀a';reg.RegEx := 'a{3}'; //这里指定重复 3 次reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: a aa ◆◆a ab abb abbba a 呀aFreeAndNil(reg);FreeAndNil(reg);end;//上面这个 {1,} 和 + 是等效的;//还有 {0,1} 与 ? 是等效的;//{0,} 和 * 是等效的Delphi 正则表达式语法(3): 匹配范围// [A-Z]: 匹配所有大写字母varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007 for Win32';reg.RegEx := '[A-Z]';reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆ode◆ear ◆elphi 2007 for ◆in32FreeAndNil(reg);end;// [a-z]: 匹配所有小写字母varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);// ^ 排除 [] 中的所有varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007 for Win32';reg.RegEx := '[^Ci0-2]'; //这里排除了大写字母: C; 小写字母: i; 数字: 0-2reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: C◆◆◆◆◆◆◆◆◆◆◆◆◆i◆200◆◆◆◆◆◆◆i◆◆2FreeAndNil(reg);end;Delphi 正则表达式语法(4): 常用转义字符与 .// \d 匹配所有数字, 相当于 [0-9]varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '期待Delphi 2008 for Win32!';reg.RegEx := '\d';reg.Replacement := '◆';reg.ReplaceAll;reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: 期待Delphi◆2008◆for◆Win32!FreeAndNil(reg);end;{\f : 换页符\n : 换行符\r : 回车符\t : 制表符(Tab)\v : 垂直制表符}// \S 匹配任何非空白, 相当于 [^\f\n\r\t\v]varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '期待Delphi 2008 for Win32!';reg.RegEx := '\S';reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆FreeAndNil(reg);end;// \x 匹配十六进制的 ASCIIvarreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi';reg.RegEx := '\x61'; // a 的 ASCII 值是 97, 也就是十六进制的 61reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: CodeGe◆r DelphiFreeAndNil(reg);end;//非常遗憾 TPerlRegEx 不能使用 \u 或 \U 匹配 Unicode 字符!// . 匹配除换行符以外的任何字符varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '期待' + #10 + 'Delphi 2008 for Win32!'; //#10是换行符reg.RegEx := '.';reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject);{返回:◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆}FreeAndNil(reg);end;// \B 非单词边界varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'Delphi MyDelphi2007 MyDelphi';reg.RegEx := '\BDelphi\B'; //现在只有 MyDelphi2007 中的Delphi 属于非单词边界reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: Delphi My◆2007 MyDelphiFreeAndNil(reg);end;// ^ 行首varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'Delphi Delphi2007 MyDelphi';reg.RegEx := '^Del'; //匹配在行首的 Delreg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆phi Delphi2007 MyDelphi FreeAndNil(reg);FreeAndNil(reg);end;// \Z 也标记行尾varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'Delphi Delphi2007 MyDelphi';reg.RegEx := 'phi\Z'; //匹配在行尾的 phireg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: Delphi Delphi2007 MyDel ◆FreeAndNil(reg);end;// 测试时, \Z 不区分大小写; \A 区分Delphi 正则表达式语法(6): 贪婪匹配与非贪婪匹配//贪婪匹配varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '<html><head><title>标题</title></head><body>内容</body></html>';reg.RegEx := '<.*>'; //将会全部匹配, 因为两头分别是: <和>reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆FreeAndNil(reg);end;//非贪婪匹配varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '<html><head><title>标题</title></head><body>内容</body></html>';reg.RegEx := '<.*?>'; // *? 是非贪婪匹配方法之一, 将匹配每组<>reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆标题◆◆◆内容◆◆FreeAndNil(reg);end;//更多贪婪与非贪婪匹配对照:Delphi 正则表达式语法(8): 引用子表达式- 也叫反向引用//准备: 我们先写一个搜索所有英文单词的表达式varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'one two three four five six seven eight nine ten';reg.RegEx := '\b[A-Za-z]+\b'; //这个表达式就可以找到所有的英文单词reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆◆◆◆◆◆◆◆FreeAndNil(reg);end;//假如我们只需要每个单词的第一个字母呢? 这要用到子表达式varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'one two three four five six seven eight nine ten';reg.RegEx := '\b([A-Za-z])[A-Za-z]*\b'; //注意表达式中有子表达式, 在 () 中reg.Replacement := '\1'; // \1 引用了第一个子表达式//匹配左边varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '111, 222, ¥333, ¥444';reg.RegEx := '(?<=¥)\d{3}'; // ?<=reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: 111, 222, ¥◆, ¥◆FreeAndNil(reg);end;//不匹配左边varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '111, 222, ¥333, ¥444';reg.RegEx := '(?<!¥)\d{3}'; // ?<!reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆, ◆, ¥333, ¥444FreeAndNil(reg);end;Delphi 正则表达式语法(10): 选项// preCaseLess: 不区分大小写, 相当于其他语言中的 ivarreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'abc ABC aBc';reg.RegEx := 'abc';reg.Replacement := '◆';reg.Options := [preCaseLess]; //选项是集合类型的reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆FreeAndNil(reg);end;// preAnchored: 只匹配字符串开始, 相当于 ^, 不过还是有区别的varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'abc abc abc';reg.RegEx := 'abc';reg.Replacement := '◆';reg.Options := [preAnchored]; //指定: preAnchored reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆ abc abcFreeAndNil(reg);end;{preAnchored 选项和 ^ 的区别:1、任何情况下, preAnchored 只匹配字符串开头;2、在 preMultiLine 选项模式下, ^ 还能匹配每行的开头;3、^ 还有其他用途.}// preDollarEndOnly: 让 $ 只匹配字符串结尾varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'abc abc abc'#13#10 +'abc abc abc'#13#10 +'abc abc abc';reg.RegEx := 'abc$'; //当然需要有 $reg.Replacement := '◆';reg.Options := [preDollarEndOnly]; //指定: preDollarEndOnlyreg.ReplaceAll;ShowMessage(reg.Subject);{返回:abc abc abcabc abc abcabc abc ◆}FreeAndNil(reg);end;// preMultiLine: 多行匹配, 相当于其他语言中的 mvarreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'abc abc abc'#13#10 +'abc abc abc'#13#10 +'abc abc abc';reg.RegEx := '^abc';reg.Replacement := '◆';reg.Options := [preMultiLine]; //指定: preMultiLine reg.ReplaceAll;ShowMessage(reg.Subject);{返回:◆ abc abc◆ abc abc◆ abc abc}{如果不指定 preMultiLine 将返回:◆ abc abcabc abc abcabc abc abc}FreeAndNil(reg);end;{1、preMultiLine 是对 ^ 和 $ 的扩展使用;2、在指定了 [preAnchored] 或 [preDollarEndOnly] 的情况下无效. }// preSingleLine: 让特殊符号 . 能够匹配换行符 (. 的本意是匹配换行符以外的任意字符)varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'aaa;bbb;'#13#10 +'111;222;'#13#10 +'AAA;BBB;';reg.RegEx := ';.';reg.Replacement := '◆';reg.Options := [preSingleLine]; //指定: preSingleLinereg.ReplaceAll;ShowMessage(reg.Subject);{返回:aaa◆bb◆111◆22◆AAA◆BB;}{如果不指定 preMultiLine 将返回:aaa◆bb;111◆22;AAA◆BB;}FreeAndNil(reg);end;// preUnGreedy: 指定为非贪婪模式varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := '《Delphi》and《C++Builder》';reg.RegEx := '《.*》';reg.Replacement := '◆';reg.Options := [preUnGreedy]; //指定: preUnGreedy { 在本例中, reg.RegEx := '《.*?》'; 可以达到同样的效果} reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆and◆ ; 如果不指定preUnGreedy, 将返回: ◆FreeAndNil(reg);end;// preExtended: 指定为扩展模式varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'Delphi C++Builder';reg.RegEx := 'i\x20C'; // \x20 是用十六进制的方式表示的空格 reg.Replacement := '◆';reg.Options := [preExtended]; //指定: preExtendedreg.ReplaceAll;ShowMessage(reg.Subject); //返回: Delph◆++BuilderFreeAndNil(reg);end;{preExtended 是最复杂的一个选项:1、它会忽略表达式中的空白, 譬如: 本例中的表达式如果是 'i C' 将不会匹配成功;2、空白要用相应的十六进制表示, 譬如用 \x20 表示空格;3、把表达式中从 # 到行尾的部分当作注释而被忽略;4、如果要使用 # ,需要用 \# 代替;5、表达式的标准注释是: (?#...) 及其中 # 后面的内容均为注释, 不管指定 preExtended 与否}关于选项preExtra:如果表达式中需要特殊字符^ $ ( ) [ ] { } . ? + * | \ 时, 需要加转义符号\ ;默认状态下, 其他字符前面添加了\ 会识别为字符本身;preExtra 选项应该就是禁止这种情况的, 也就是不要在非特殊字符前加\ ;但测试效果 ... 也许是我没弄明白!还有三个状态选项: preNotBOL, preNotEOL, preNotEmptyreg.State := [preNotBOL] 是让标记开始的^ 无效;reg.State := [preNotEOL] 是让标记结尾的$ 无效;reg.State := [preNotEmpty] 没弄明白!另外这些选择是可以组合使用的, 譬如:reg.Options := [preCaseLess, preMultiLine, preSingleLine];reg.State := [preNotBOL, preNotEOL];Delphi 正则表达式之TPerlRegEx 类的属性与方法(1): 查找//查找是否存在varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);//显示找到的第一个varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007 for Win32';reg.RegEx := '\d';if reg.Match thenShowMessage(reg.MatchedExpression) //2elseShowMessage('没找到');FreeAndNil(reg);end;//分别显示找到的每一个和总数varreg: TPerlRegEx;num: Integer; //用 num 来计数beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007 for Win32';reg.RegEx := '\d';num := 0;while reg.MatchAgain do//MatchAgain 是下一个beginShowMessage(reg.MatchedExpression); //将分别显示: 2 0 0 73 2Inc(num);end;ShowMessage(IntToStr(num)); //6Delphi 正则表达式之TPerlRegEx 类的属性与方法(2): 关于子表达式// MatchedExpression 与 SubExpressions[0]varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'CodeGear Delphi 2007';reg.RegEx := 'Delphi';while reg.MatchAgain dobeginShowMessage(reg.MatchedExpression); //Delphi; 这是匹配到的内容ShowMessage(reg.SubExpressions[0]); //Delphi; 也可以这样显示匹配到的内容end;SubExpressions 是一个数组:SubExpressions[1] 储存第 1 个表达式匹配的内容;SubExpressions[2] 储存第 2 个表达式匹配的内容;SubExpressions[n] 储存第 n 个表达式匹配的内容;SubExpressions[0] 储存整个表达式匹配的内容;MatchedExpression 表示的不过是 SubExpressions[0].}FreeAndNil(reg);end;//提取子表达式匹配到的内容varreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'abc A1111 BB222 CCC33 DDDD4';reg.RegEx := '\b([A-D]+)([1-4]+)\b'; //这个表达式有两个子表达式构成while reg.MatchAgain dobeginShowMessage(reg.SubExpressions[0]); //将分别显示: A1111 BB222 CCC33 DDDD4ShowMessage(reg.SubExpressions[1]); //将分别显示: A BB CCC DDDDDelphi 正则表达式之TPerlRegEx 类的属性与方法(3): Start、Stop //设定搜索范围: Start、Stopvarreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'ababab';reg.RegEx := 'ab';reg.Replacement := '◆';reg.Start := 1;reg.Stop := 2;while reg.MatchAgain dobeginreg.Replace;end;ShowMessage(reg.Subject); //返回: ◆ababreg.Subject := 'ababab';reg.Start := 3;reg.Stop := 4;while reg.MatchAgain dobeginreg.Replace;end;ShowMessage(reg.Subject); //返回: ab◆abreg.Subject := 'ababab';reg.Start := 5;reg.Stop := 6;while reg.MatchAgain dobeginreg.Replace;end;ShowMessage(reg.Subject); //返回: abab◆FreeAndNil(reg);end;Delphi 正则表达式之TPerlRegEx 类的属性与方法(4): Replace// Replacevarreg: TPerlRegEx;reg := TPerlRegEx.Create(nil);reg.RegEx := 'ab';reg.Replacement := '◆';reg.Subject := 'ababab';reg.ReplaceAll;ShowMessage(reg.Subject); //返回: ◆◆◆reg.Subject := 'ababab';//下面四行程序, 相当于 reg.ReplaceAll;while reg.MatchAgain dobeginreg.Replace;end;ShowMessage(reg.Subject); //返回: ◆◆◆FreeAndNil(reg);end;{ReplaceAll 函数返回的是 Boolean;Replace 函数返回的是 Replacement 的值, 当然是不能赋值的, 它仅仅是返回值.}Delphi 正则表达式之TPerlRegEx 类的属性与方法(5): Compile、Study// Compile、Studyreg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.RegEx := 'ab';reg.Options := [preCaseLess];pile; {编译表达式}reg.Study; {Study 方法会检查是否编译, 如果没有编译则执行Compile}reg.Replacement := '◆';reg.Subject := 'abAbaB';reg.ReplaceAll;ShowMessage(reg.Subject); {返回: ◆◆◆}FreeAndNil(reg);end;{编译表达式, 会加快执行速度、降低启动速度;如果表达式比较复杂而又多次执行, 应该先编译;编译内容包括表达式选项.}Delphi 正则表达式之TPerlRegEx 类的属性与方法(6): EscapeRegExChars 函数// EscapeRegExChars 函数可以自动为特殊字符加转义符号 \reg: TPerlRegEx;beginreg := TPerlRegEx.Create(nil);reg.Subject := 'C++Builer';reg.RegEx := reg.EscapeRegExChars('C+') + '{2}'; {相当于'C\+{2}'}reg.Replacement := '◆';reg.ReplaceAll;ShowMessage(reg.Subject); {返回: ◆Builer}FreeAndNil(reg);end;Delphi 正则表达式之TPerlRegEx 类的属性与方法(7): Split 函数//字符串分割: Splitvarreg: TPerlRegEx;List: TStrings;beginList := TStringList.Create;reg := TPerlRegEx.Create(nil);reg.Subject := 'aaa,bbb,ccc,ddd';reg.RegEx := ','; {这里可是运行相当复杂的分割符啊}reg.Split(List,MaxInt); {第一个参数读入的是 Subject; 第二个参数是分成多少份}{ 输入一个最大整数, 表示能分多少就分多少}ShowMessage(List.Text);{返回:aaabbbcccddd}FreeAndNil(reg);List.Free;end;。

相关主题