VBScript - 正则表达式

正则表达式是形成模式的字符序列,主要用于搜索和替换。 创建模式的目的是匹配特定的字符串,以便开发者可以根据条件提取字符并替换某些字符。

RegExp 正则表达式对象

RegExp 对象帮助开发人员匹配字符串模式,其属性和方法帮助我们轻松使用正则表达式。 它类似于 JavaScript 中的 RegExp

属性

  • Pattern − Pattern 方法表示一个用于定义正则表达式的字符串,应在使用正则表达式对象之前设置它。

  • IgnoreCase − 一个布尔属性,表示是否应针对字符串中的所有可能匹配项来测试正则表达式(如果为真或为假)。 如果未明确指定,IgnoreCase 值将设置为 False。

  • Global − 一个布尔属性,表示是否应针对字符串中的所有可能匹配项测试正则表达式。 如果未明确指定,全局值将设置为 False。

方法

  • Test(search-string) − Test 方法以字符串作为参数,如果正则表达式能够成功匹配字符串,则返回 True,否则返回 False。

  • Replace(search-string, replace-string) − Replace 方法有 2 个参数。 如果搜索成功,则会用替换字符串替换该匹配项,并返回新字符串。 如果没有匹配项,则返回原始搜索字符串。

  • Execute(search-string) − Execute 方法的工作方式与 Replace 类似,只不过它返回一个 Matches 集合对象,其中包含每个成功匹配的 Match 对象。 它不会修改原始字符串。

匹配集合对象

Matches 集合对象作为 Execute 方法的结果返回。 该集合对象可以包含零个或多个 Match 对象,并且该对象的属性是只读的。

  • Count − Count 方法表示集合中匹配对象的数量。

  • Item − Item 方法允许从匹配集合对象访问匹配对象。

匹配对象

Match 对象包含在 matches 集合对象中。 这些对象代表搜索字符串后成功匹配。

  • FirstIndex − 它表示原始字符串中发生匹配的位置。 该索引从零开始,这意味着字符串中的第一个位置是 0。

  • Length − 表示匹配字符串总长度的值。

  • Value − 表示匹配值或文本的值。 这也是访问 Match 对象时的默认值。

关于模式参数的所有内容

模式构建与 PERL 类似。 使用正则表达式时,模式构建是最重要的事情。 在本节中,我们将讨论如何根据各种因素创建模式。

位置匹配

位置匹配的意义在于确保我们将正则表达式放置在正确的位置。

符号 描述
^ 仅匹配字符串的开头。
$ 仅匹配字符串的末尾。
\b 匹配任何单词边界
\B 匹配任何非单词边界

文字匹配

任何形式的字符,如字母、数字或特殊字符,甚至十进制、十六进制都可以被视为文字。 由于很少有字符在正则表达式上下文中已经具有特殊含义,因此我们需要使用转义序列对它们进行转义。

符号 描述
字母数字 仅匹配字母和数字字符。
匹配新行。
\[ 仅匹配 [ 文字
\] 仅匹配 ] 文字
\( 仅匹配( 文字
\) 仅匹配 ) 文字
匹配水平制表符
\v 匹配垂直制表符
\| 仅匹配 | 文字
\{ 仅匹配 { 文字
\} 仅匹配 } 文字
\ 仅匹配 \ 文字
\? 仅匹配 ? 字面
\* 仅匹配 * 文字
\+ 仅匹配 + 文字
\. 仅匹配 . 文字
\b 匹配任何单词边界
\B 匹配任何非单词边界
\f 匹配换页符
匹配回车符
\xxx 匹配八进制数 xxx 的 ASCII 字符。
\xdd 匹配十六进制数dd的ASCII字符。
\uxxxx 匹配 UNICODE 文字 xxxx 的 ASCII 字符。

字符类匹配

字符类是通过自定义分组形成的模式,并括在 [ ] 大括号内。 如果我们期望一个不应出现在列表中的字符类,那么我们应该使用负号(即大写字母 ^)忽略该特定字符类。

符号 描述
[xyz] 匹配字符集中包含的任何字符类。
[^xyz] 匹配任何未包含在字符集中的字符类。
.
\w 匹配任何单词字符类。 相当于[a-zA-Z_0-9]
\W 匹配任何非单词字符类。 相当于[^a-zA-Z_0-9]
\d 匹配任何数字类别。 相当于[0-9]。
\D 匹配任何非数字字符类。 相当于[^0-9]。
\s 匹配任何空格字符类。 相当于[\v\f]
\S 匹配任何非空格字符类。 相当于[^\v\f]

重复匹配

重复匹配允许在正则表达式内进行多次搜索。 它还指定元素在正则表达式中重复的次数。

符号 描述
* 匹配零次或多次出现的给定正则表达式。 相当于 {0,}。
+ 匹配一个或多个出现的给定正则表达式。 相当于{1,}。
? 匹配零次或一次出现的给定正则表达式。 相当于{0,1}。
{x} 精确匹配给定正则表达式的 x 次出现。
{x,} 匹配至少 x 次或多次出现的给定正则表达式。
{x,y} 匹配给定正则表达式的 x 到 y 次出现次数。

交替和分组

交替和分组可帮助开发人员创建更复杂的正则表达式,特别是处理正则表达式中的复杂子句,从而提供了极大的灵活性和控制力。

符号 描述
0 对子句进行分组以创建子句。 "(xy)?(z)"匹配"xyz"或"z"。
| Alternation 组合一个正则表达式子句,然后匹配任何单个子句。 "(ij)|(23)|(pq)"匹配"ij"或"23"或"pq"。

构建正则表达式

下面给出了一些示例,清楚地解释了如何构建正则表达式。

正则表达式 描述
"^\s*.." and "..\s*$" 表示单行中可以有任意数量的前导和尾随空格字符。
"((\$\s?)|(#\s?))?" 表示可选的 $ 或 # 符号,后跟可选的空格。
"((\d+(\.(\d\d)?)?))" 表示至少存在一位数字,后跟可选的小数点和小数点后两位数字。

示例

下面的示例检查用户输入的电子邮件 ID 的格式是否应匹配,以便有一个电子邮件 ID 后跟"@",然后再跟域名。

<!DOCTYPE html>
<html>
   <body>
      <script language = "vbscript" type = "text/vbscript">
         strid = "welcome.user@tutorialspoint.co.us"
         Set re = New RegExp
         With re
            .Pattern    = "^[\w-\.]{1,}\@([\da-zA-Z-]{1,}\.){1,}[\da-zA-Z-]{2,3}$"
            .IgnoreCase = False
            .Global     = False
         End With
        
         ' Test method returns TRUE if a match is found
         If re.Test( strid ) Then
            Document.write(strid & " is a valid e-mail address")
         Else
            Document.write(strid & " is NOT a valid e-mail address")
         End If
        
        Set re = Nothing
      </script>
   </body>
</html>