MySQL 8 教程

MySQL - 主页 MySQL - 简介 MySQL - 功能 MySQL - 版本 MySQL - 变量 MySQL - 安装 MySQL - 管理 MySQL - PHP 语法 MySQL - Node.js 语法 MySQL - Java 语法 MySQL - Python 语法 MySQL - 连接 MySQL - Workbench

MySQL 8 数据库

MySQL - 创建数据库 MySQL - 删除数据库 MySQL - 选择数据库 MySQL - 显示数据库 MySQL - 复制数据库 MySQL - 数据库导出 MySQL - 数据库导入 MySQL - 数据库信息

MySQL 8 用户

MySQL - 创建用户 MySQL - 删除用户 MySQL - 显示用户 MySQL - 更改密码 MySQL - 授予权限 MySQL - 显示权限 MySQL - 撤销权限 MySQL - 锁定用户账户 MySQL - 解锁用户账户

MySQL 8 表

MySQL - 创建表 MySQL - 显示表 MySQL - 修改表 MySQL - 重命名表 MySQL - 克隆表 MySQL - 截断表 MySQL - 临时表 MySQL - 修复表 MySQL - 描述表 MySQL - 添加/删除列 MySQL - 显示列 MySQL - 重命名列 MySQL - 表锁定 MySQL - 删除表 MySQL - 派生表

MySQL 8 查询

MySQL - 查询 MySQL - 约束 MySQL - INSERT 插入查询 MySQL - SELECT 查询 MySQL - UPDATE 更新查询 MySQL - DELETE删除查询 MySQL - REPLACE 替换查询 MySQL - 忽略插入 MySQL - 重复键更新时插入 MySQL - 插入到另一个表语句

MySQL 8 视图

MySQL - 创建视图 MySQL - 更新视图 MySQL - 删除视图 MySQL - 重命名视图

MySQL 8 索引

MySQL - 索引 MySQL - 创建索引 MySQL - 删除索引 MySQL - 显示索引 MySQL - 唯一索引 MySQL - 聚集索引 MySQL - 非聚集索引

MySQL 运算符和子句

MySQL - Where 子句 MySQL - Limit 子句 MySQL - Distinct 子句 MySQL - Order By 子句 MySQL - Group By 子句 MySQL - Having 子句 MySQL - AND 运算符 MySQL - OR 或运算符 MySQL - LIKE 运算符 MySQL - IN 运算符 MySQL - ANY 运算符 MySQL - Exists 运算符 MySQL - NOT 运算符 MySQL - NOT EQUAL 运算符 MySQL - IS NULL 运算符 MySQL - IS NOT NULL 运算符 MySQL - Between 运算符 MySQL - UNION 运算符 MySQL - UNION 与 UNION ALL MySQL - MINUS 运算符 MySQL - INTERSECT 运算符 MySQL - INTERVAL 运算符

MySQL 连接

MySQL - 使用连接 MySQL - Inner Join 内连接 MySQL - LEFT JOIN 左连接 MySQL - RIGHT JOIN 右连接 MySQL - CROSS JOIN 交叉连接 MySQL - 全连接 MySQL - 自连接 MySQL - Delete Join 删除连接 MySQL - UPDATE JOIN 更新连接 MySQL - 联合 vs 连接

MySQL 键

MySQL - UNIQUE 唯一键 MySQL - PRIMARY KEY 主键 MySQL - FOREIGN KEY 外键 MySQL - 复合键 MySQL - 备用键

MySQL 触发器

MySQL - 触发器 MySQL - 创建触发器 MySQL - 显示触发器 MySQL - 删除触发器 MySQL - 插入前触发器 MySQL - 插入后触发器 MySQL - 更新前触发器 MySQL - 更新后触发器 MySQL - 删除前触发器 MySQL - 删除后触发器

MySQL 8 数据类型

MySQL - 数据类型 MySQL - VARCHAR MySQL - BOOLEAN MySQL - ENUM 枚举 MySQL - DECIMAL 十进制 MySQL - INT 整数 MySQL - FLOAT 浮点数 MySQL - BIT 位 MySQL - TINYINT 微小整数 MySQL - BLOB 二进制大对象 MySQL - SET 集合

MySQL 正则表达式

MySQL - 正则表达式 MySQL - RLIKE 运算符 MySQL - NOT LIKE 运算符 MySQL - NOT REGEXP 运算符 MySQL - regexp_instr() 函数 MySQL - regexp_like() 函数 MySQL - regexp_replace() 函数 MySQL - regexp_substr() 函数

MySQL 全文搜索

MySQL - 全文搜索 MySQL - 自然语言全文搜索 MySQL - 布尔全文搜索 MySQL - 查询扩展全文搜索 MySQL - ngram 全文解析器

MySQL8 函数和运算符

MySQL - 日期和时间函数 MySQL - 算术运算符 MySQL - 数字函数 MySQL - 字符串函数 MySQL - 聚合函数

MySQL 8 其他概念

MySQL - NULL 值 MySQL - 事务 MySQL - 序列 MySQL - 处理重复项 MySQL - SQL 注入 MySQL - 子查询 MySQL - 注释 MySQL - 检查约束 MySQL - 存储引擎 MySQL - 将表导出为 CSV 文件 MySQL - 将 CSV 文件导入数据库 MySQL - UUID MySQL - 通用表表达式 MySQL - 级联删除 MySQL - Upsert 操作 MySQL - 水平分区 MySQL - 垂直分区 MySQL - 游标 MySQL - 存储函数 MySQL - SIGNAL 异常处理 MySQL - RESIGNAL 异常处理 MySQL - 字符集 MySQL - 排序规则 MySQL - 通配符 MySQL - 别名 MySQL - ROLLUP 超级聚合 MySQL - 当前日期 MySQL - 字面量 MySQL - 存储过程 MySQL - EXPLAIN 语句 MySQL - JSON MySQL - 标准差 MySQL - 查找重复记录 MySQL - 删除重复记录 MySQL - 选择随机记录 MySQL - 显示进程列表 MySQL - 更改列类型 MySQL - 重置自动增量 MySQL - Coalesce() 函数

MySQL 8 实用资源

MySQL - 实用函数 MySQL - 语句参考 MySQL - 快速指南 MySQL - 实用资源 MySQL - 讨论


MySQL - 自然语言全文搜索

在深入探讨自然语言全文搜索的概念之前,让我们先了解一下它的背景。如今,用于搜索的关键词可能并不总是与用户期望的结果相匹配。因此,搜索引擎的设计重点是提高搜索相关性,以缩小搜索查询和搜索结果之间的准确率差距。因此,结果将按与搜索关键词最相关的顺序显示。

同样,在像 MySQL 这样的关系数据库中,全文搜索是一种用于检索可能与搜索关键词不完全匹配的结果集的技术。全文搜索使用三种搜索模式 -

  • 自然语言模式

  • 查询扩展模式

  • 布尔模式

自然语言全文搜索在自然语言模式下执行常规的全文搜索。在此模式下执行全文搜索时,搜索结果将按其与关键词(执行搜索的依据)的相关性顺序显示。这是全文搜索的默认模式。

由于这是全文搜索,因此必须将全文索引应用于基于文本的列(例如 CHAR、VARCHAR 和 TEXT 数据类型的列)。全文索引是一种特殊类型的索引,用于搜索文本值中的关键字,而不是尝试将关键字与这些列值进行比较。

语法

以下是执行自然语言全文搜索的基本语法 -

SELECT * FROM table_name
WHERE MATCH(column_name(s))
AGAINST ('keyword_name' IN NATURAL LANGUAGE MODE);

示例

通过以下示例,我们将了解如何在数据库表上执行自然语言全文搜索。

为此,我们首先创建一个名为 ARTICLES 的表,其中包含文章的标题和描述。FULLTEXT 索引应用于文本列 article_titledescriptions,如下所示 -

CREATE TABLE ARTICLES (
   ID INT AUTO_INCREMENT NOT NULL PRIMARY KEY,
   ARTICLE_TITLE VARCHAR(100),
   DESCRIPTION TEXT,
   FULLTEXT (ARTICLE_TITLE, DESCRIPTION)
) ENGINE = InnoDB;

现在,让我们使用以下查询将文章的详细信息(如标题和描述)插入到此表中 -

INSERT INTO ARTICLES (ARTICLE_TITLE, DESCRIPTION) VALUES 
('MySQL Tutorial', 'MySQL is a relational database system that uses SQL to structure data stored'),
('Java Tutorial', 'Java is an object-oriented and platform-independent programming language'),
('Hadoop Tutorial', 'Hadoop is framework that is used to process large sets of data'),
('Big Data Tutorial', 'Big Data refers to data that has wider variety of data sets in larger numbers'),
('JDBC Tutorial', 'JDBC is a Java based technology used for database connectivity');

创建表如下 −

ID ARTICLE_TITLE DESCRIPTION
1 MySQL Tutorial MySQL is a relational database system that uses SQL to structure data stored
2 Java Tutorial Java is an object-oriented and platform-independent programming language
3 Hadoop Tutorial Hadoop is framework that is used to process large sets of data
4 Big Data Tutorial Big Data refers to data that has wider variety of data sets in larger numbers
5 JDBC Tutorial JDBC is a Java based technology used for database connectivity

使用全文搜索中的自然语言模式,以关键字"数据集"搜索与数据相关的文章记录。

SELECT * FROM ARTICLES 
WHERE MATCH(ARTICLE_TITLE, DESCRIPTION) 
AGAINST ('data set' IN NATURAL LANGUAGE MODE);

输出

以下是输出 -

ID ARTICLE_TITLE DESCRIPTION
4 Big Data Tutorial Big Data refers to data that has wider variety of data sets in larger numbers
1 MySQL Tutorial MySQL is a relational database system that uses SQL to structure data stored
3 Hadoop Tutorial Hadoop is framework that is used to process large sets of data

如上所示,在表格中的所有文章中,我们获得了三条与术语"数据集"相关的搜索结果,并按其相关性排序。但请注意,关键字"数据集"在"MySQL 教程"文章记录中并非完全匹配,但由于 MySQL 也处理数据集,因此仍然会被检索到。

自然语言全文搜索使用 tf-idf 算法,其中"tf"表示词频,"idf"表示逆文档频率。搜索指的是某个词在单个文档中出现的频率以及该词出现的文档数量。然而,搜索通常会忽略一些词,例如包含少于特定字符的词。InnoDB 会忽略少于 3 个字符的词,而 MyISAM 会忽略少于 4 个字符的词。这些词被称为停用词(the、a、an、are 等)。

示例

在下面的示例中,我们将对上面创建的 ARTICLES 表执行简单的自然语言全文搜索。让我们通过对两个关键词"Big Tutorial"和"is Tutorial"执行全文搜索来了解停用词对全文搜索的影响。

搜索"Big Tutorial":

以下查询在自然语言模式下针对"Big Tutorial"关键词执行全文搜索 -

SELECT ARTICLE_TITLE, DEscription FROM ARTICLES
WHERE MATCH(ARTICLE_TITLE, DEscription)
AGAINST ('Big Tutorial' IN NATURAL LANGUAGE MODE);

输出:

输出结果为:-

ARTICLE_TITLE DESCRIPTION
Big Data Tutorial Big Data refers to data that has wider variety of data sets in larger numbers
MySQL Tutorial MySQL is a relational database system that uses SQL to structure data stored
Java Tutorial Java is an object-oriented and platform-independent programming language
Hadoop Tutorial Hadoop is framework that is used to process large sets of data
JDBC Tutorial JDBC is a Java based technology used for database connectivity

搜索"is Tutorial":

以下查询在自然语言模式下针对"is Tutorial"关键字执行全文搜索 -

SELECT ARTICLE_TITLE, DEscription FROM Articles
WHERE MATCH(ARTICLE_TITLE, DEscription)
AGAINST ('is Tutorial' IN NATURAL LANGUAGE MODE);

输出:

输出结果如下 -

ARTICLE_TITLE DESCRIPTION
MySQL Tutorial MySQL is a relational database system that uses SQL to structure data stored
Java Tutorial Java is an object-oriented and platform-independent programming language
Hadoop Tutorial Hadoop is framework that is used to process large sets of data
Big Data Tutorial Big Data refers to data that has wider variety of data sets in larger numbers
JDBC Tutorial JDBC is a Java based technology used for database connectivity

如上例所示,由于"Tutorial"一词出现在表的所有记录中,因此两种情况下都会检索到所有记录。但是,相关性顺序由指定关键字的第二个单词决定。

在第一种情况下,由于"Big Data Tutorial"中包含"Big"一词,因此首先检索该记录。在第二种情况下,由于"is"是停用词,结果集中记录的顺序与原始表的顺序相同,因此被忽略。

使用客户端程序进行自然语言全文搜索

我们也可以使用客户端程序在 MySQL 数据库上执行自然语言全文搜索操作。

语法

要通过 PHP 程序执行自然语言全文搜索,我们需要使用 mysqli 函数 query() 执行以下 SELECT 语句,如下所示 -

$sql = "SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, DEscription) AGAINST ('data set' IN NATURAL LANGUAGE MODE)";
$mysqli->query($sql);

要通过 JavaScript 程序执行自然语言全文搜索,我们需要使用 mysql2 库的 query() 函数执行以下 SELECT 语句,如下所示 -

sql = `SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, DEscription) AGAINST ('data set' IN NATURAL LANGUAGE MODE)`;
con.query(sql);

要通过 Java 程序执行自然语言全文搜索,我们需要使用 JDBC 函数 executeQuery() 执行 SELECT 语句,如下所示 -

String sql = "SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, DEscription) AGAINST ('data set' IN NATURAL LANGUAGE MODE)";
statement.executeQuery(sql);

要通过 Python 程序执行自然语言全文搜索,我们需要使用 MySQL Connector/Pythonexecute() 函数执行 SELECT 语句,如下所示 -

natural_language_search_query = 'SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, DEscription) AGAINST ('data set' IN NATURAL LANGUAGE MODE)'
cursorObj.execute(natural_language_search_query)

示例

以下是程序 -

$dbhost = 'localhost';
$dbuser = 'root';
$dbpass = 'password';
$dbname = 'TUTORIALS';
$mysqli = new mysqli($dbhost, $dbuser, $dbpass, $dbname);
if ($mysqli->connect_errno) {
    printf("Connect failed: %s
", $mysqli->connect_error); exit(); } // printf('Connected successfully.
'); $s = "SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, DESCRIPTION) AGAINST ('data set' IN NATURAL LANGUAGE MODE)"; if ($r = $mysqli->query($s)) { printf("Table Records: "); while ($row = $r->fetch_assoc()) { printf(" ID: %d, Title: %s, Descriptions: %s", $row["id"], $row["ARTICLE_TITLE"], $row["DESCRIPTION"]); printf(" "); } } else { printf('Failed'); } $mysqli->close();

输出

获得的输出如下所示 -

Table Records:
ID: 4, Title: Big Data Tutorial, Descriptions: Big Data refers to data that has wider variety of data sets in larger numbers
ID: 1, Title: MySQL Tutorial, Descriptions: MySQL is a relational database system that uses SQL to structure data stored
ID: 3, Title: Hadoop Tutorial, Descriptions: Hadoop is framework that is used to process large sets of data   
var mysql = require("mysql2");
var con = mysql.createConnection({
  host: "localhost",
  user: "root",
  password: "password",
}); //连接到 MySQL

con.connect(function (err) {
  if (err) throw err;
  //   console.log("Connected successfully...!");
  //   console.log("--------------------------");
  sql = "USE TUTORIALS";
  con.query(sql);
 //display the table details!...
  sql = `SELECT * FROM Articles  WHERE MATCH(ARTICLE_TITLE, DESCRIPTION)  AGAINST ('data set' IN NATURAL LANGUAGE MODE)`;
  con.query(sql, function (err, result) {
    if (err) throw err;
    console.log(result);
  });
});    

输出

获得的输出如下所示 -

We get the following output, after executing the above NodeJs Program.
[
  {
    id: 4,
    ARTICLE_TITLE: 'Big Data Tutorial',
    DESCRIPTION: 'Big Data refers to data that has wider variety of data sets in larger numbers'
  },
  {
    id: 1,
    ARTICLE_TITLE: 'MySQL Tutorial',
    DESCRIPTION: 'MySQL is a relational database system that uses SQL to structure data stored'
  },
  {
    id: 3,
    ARTICLE_TITLE: 'Hadoop Tutorial',
    DESCRIPTION: 'Hadoop is framework that is used to process large sets of data'
  }
]  
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

public class NaturalLanguageSearch {
   public static void main(String[] args) {
      String url = "jdbc:mysql://localhost:3306/TUTORIALS";
      String username = "root";
      String password = "password";
      try {
         Class.forName("com.mysql.cj.jdbc.Driver");
         Connection connection = DriverManager.getConnection(url, username, password);
         Statement statement = connection.createStatement();
         System.out.println("Connected successfully...!");
        //displaying the fulltext records in the Natural language mode:
         ResultSet resultSet = statement.executeQuery("SELECT * FROM Articles WHERE MATCH(ARTICLE_TITLE, descriptions)  AGAINST ('data set' IN NATURAL LANGUAGE MODE)");
         while (resultSet.next()){
            System.out.println(resultSet.getString(1)+" "+resultSet.getString(2)+ " "+resultSet.getString(3));
         }
         connection.close();
      } catch (Exception e) {
         System.out.println(e);
      }
   }
}          

输出

获得的输出如下所示 -

Connected successfully...!
4 Big Data Tutorial Big Data refers to data that has wider variety of data sets in larger numbers
1 MySQL Tutorial MySQL is a relational database system that uses SQL to structure data stored
3 Hadoop Tutorial Hadoop is framework that is used to process large sets of data
import mysql.connector
# 建立连接
connection = mysql.connector.connect(
   host='localhost',
   user='root',
   password='password',
   database='tut'
)
# 创建游标对象
cursorObj = connection.cursor()
natural_language_search_query = '''
SELECT * FROM Articles 
WHERE MATCH(ARTICLE_TITLE, DESCRIPTION) 
AGAINST ('data set' IN NATURAL LANGUAGE MODE)
'''
cursorObj.execute(natural_language_search_query)
# 获取所有结果
results = cursorObj.fetchall()
# 显示结果
print("NATURAL LANGUAGE search results:")
for row in results:
   print(row)
cursorObj.close()
connection.close()            

输出

获得的输出如下所示 -

NATURAL LANGUAGE search results:
(4, 'Big Data Tutorial', 'Big Data refers to data that has wider variety of data sets in larger numbers')
(1, 'MySQL Tutorial', 'MySQL is a relational database system that uses SQL to structure data stored')
(3, 'Hadoop Tutorial', 'Hadoop is framework that is used to process large sets of data')