MySQL - 正则表达式
MySQL 支持各种类型的模式匹配操作,可以从大型数据库表中检索过滤后的结果集。在之前的章节中,我们已经学习了用于模式匹配的 LIKE 运算符。在本章中,我们将学习另一种基于正则表达式的模式匹配操作。
MySQL 正则表达式
正则表达式被宽泛地定义为在输入文本中表示某种模式的字符序列。它用于使用某些模式来定位或替换文本字符串;此模式可以是单个字符、多个字符或单词等。
MySQL 使用国际化 Unicode 组件 (ICU) 实现正则表达式支持,该组件提供完整的 Unicode 支持,并且支持多字节安全。
在 MySQL 中,正则表达式是一种在数据库中执行复杂搜索操作以检索所需内容的有效方法。与 LIKE 运算符不同,正则表达式不受搜索模式(例如 % 和 _)的限制,因为它们使用了其他几个元字符来扩展模式匹配期间的灵活性和控制力。这是使用 REGEXP 运算符执行的。
语法
以下是 MySQL 中 REGEXP 运算符的基本语法 -
表达式 REGEXP 模式
与 REGEXP 一起使用的模式
以下是模式表,可与 REGEXP 运算符一起使用。
模式 | 模式是什么匹配 |
---|---|
^ | 字符串开头 |
$ | 字符串结尾 |
. | 任意单个字符 |
[...] | 方括号内列出的任意字符 |
[^...] | 方括号内未列出的任意字符 |
p1|p2|p3 | 交替;匹配 p1、p2 或 p3 中的任意一个模式 |
* | 零个或多个前导元素实例 |
+ | 一个或多个前导元素实例 |
{n | n 个前导元素实例 |
{m,n | m 到 n 个前导元素实例 |
[A-Z] | 任意大写字母 |
[a-z] | 任意小写字母字母 |
[0-9] | 任意数字(0 到 9) |
[[:<:]] | 单词开头 |
[[:>:]] | 单词结尾 |
[:class:] | 字符类,例如,使用 [:alpha:] 匹配字母表中的字母 |
示例
以下示例演示了上表中提到的一些模式以及 REGEXP 运算符的用法。为此,我们首先创建一个数据库表来执行搜索。
假设我们使用以下查询创建一个名为CUSTOMERS的表 -
CREATE TABLE CUSTOMERS ( ID INT AUTO_INCREMENT, NAME VARCHAR(20) NOT NULL, AGE INT NOT NULL, ADDRESS CHAR (25), SALARY DECIMAL (18, 2), PRIMARY KEY (ID) );
现在,使用下面给出的 INSERT 语句向其中插入一些值 -
INSERT INTO CUSTOMERS (ID,NAME,AGE,ADDRESS,SALARY) VALUES (1, 'Ramesh', 32, 'Ahmedabad', 2000.00 ), (2, 'Khilan', 25, 'Delhi', 1500.00 ), (3, 'Kaushik', 23, 'Kota', 2000.00 ), (4, 'Chaitali', 25, 'Mumbai', 6500.00 ), (5, 'Hardik', 27, 'Bhopal', 8500.00 ), (6, 'Komal', 22, 'Hyderabad', 4500.00 ), (7, 'Muffy', 24, 'Indore', 10000.00 );
执行以下查询以显示上述创建的表中的所有记录 -
SELECT * FROM CUSTOMERS;
以下是 CUSTOMERS 表中的记录 -
ID | NAME | AGE | ADDRESS | SALARY |
---|---|---|---|---|
1 | Ramesh | 32 | Ahmedabad | 2000.00 |
2 | Khilan | 25 | Delhi | 1500.00 |
3 | Kaushik | 23 | Kota | 2000.00 |
4 | Chaitali | 25 | Mumbai | 6500.00 |
5 | Hardik | 27 | Bhopal | 8500.00 |
6 | Komal | 22 | Hyderabad | 4500.00 |
7 | Muffy | 24 | Indore | 10000.00 |
带模式的正则表达式 -
现在,我们在 CUSTOMERS 表中查找名称以 'k' 开头的所有记录 -
SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^k';
执行上述查询将产生以下输出 -
ID | NAME | AGE | ADDRESS | SALARY |
---|---|---|---|---|
2 | Khilan | 25 | Delhi | 1500.00 |
3 | Kaushik | 23 | Kota | 2000.00 |
6 | Komal | 22 | Hyderabad | 4500.00 |
以下查询检索 CUSTOMERS 表中所有名称以 'sh' 结尾的记录 -
SELECT * FROM CUSTOMERS WHERE NAME REGEXP 'sh$';
执行上述查询将产生以下输出 -
ID | NAME | AGE | ADDRESS | SALARY |
---|---|---|---|---|
1 | Ramesh | 32 | Ahmedabad | 2000.00 |
这里,我们检索所有姓名包含 'sh' 的记录 -
SELECT * FROM CUSTOMERS WHERE NAME REGEXP 'sh';
从输出结果可以看出,只有两个姓名包含 'sh'。
ID | NAME | AGE | ADDRESS | SALARY |
---|---|---|---|---|
1 | Ramesh | 32 | Ahmedabad | 2000.00 |
3 | Kaushik | 23 | Kota | 2000.00 |
在以下查询中,我们查找所有以元音字母开头且以 'ol' 结尾的姓名 -
SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^[aeiou].*ol$';
返回一个空集,因为 CUSTOMERS 表中没有任何以元音字母开头且以 'ol' 结尾的姓名。
Empty set (0.00 sec)
以下查询查找 CUSTOMERS 表中所有以辅音字母开头的姓名 -
SELECT * FROM CUSTOMERS WHERE NAME REGEXP '^[^aeiou]';
执行上述查询将产生以下输出 -
ID | NAME | AGE | ADDRESS | SALARY |
---|---|---|---|---|
1 | Ramesh | 32 | Ahmedabad | 2000.00 |
2 | Khilan | 25 | Delhi | 1500.00 |
3 | Kaushik | 23 | Kota | 2000.00 |
4 | Chaitali | 25 | Mumbai | 6500.00 |
5 | Hardik | 27 | Bhopal | 8500.00 |
6 | Komal | 22 | Hyderabad | 4500.00 |
7 | Muffy | 24 | Indore | 10000.00 |
正则表达式函数和运算符
以下是正则表达式函数和运算符的表格。
S. No | 函数或运算符 |
---|---|
1 |
NOT REGEXP REGEXP 的否定 |
2 |
REGEXP 检查字符串是否与正则表达式匹配 |
3 |
REGEXP_INSTR() 返回与正则表达式匹配的子字符串的起始索引表达式 |
4 |
REGEXP_LIKE() 返回字符串是否与正则表达式匹配 |
5 |
REGEXP_REPLACE() 替换与正则表达式匹配的子字符串 |
6 |
REGEXP_SUBSTR() 返回与正则表达式匹配的子字符串 |
7 |
RLIKE 检查字符串是否匹配是否使用正则表达式 |