MySQL - Union vs Join 联合与连接
MySQL 提供了各种关系运算符来处理分布在关系数据库中多个表中的数据。其中,联合和连接查询本质上用于合并来自多个表的数据。
尽管它们都用于相同的目的,即合并表,但这些运算符的工作方式之间存在许多差异。主要区别在于,UNION 运算符会将来自多个相似表的数据合并,而不考虑数据的相关性,而 JOIN 运算符仅用于合并来自多个表的相对数据。
UNION 的工作原理
UNION 是 MySQL 中的一种运算符/子句,其工作原理类似于关系代数中的联合运算符。它的作用仅仅是合并来自多个并集兼容表的信息。
如果表满足以下条件,则称其为并集兼容表:
- 要合并的表必须具有相同的列数和相同的数据类型。
- 行数不必相同。
满足这些条件后,UNION 运算符将返回来自多个表的所有行(在消除重复行之后),并将其作为结果表返回。
注意:第一个表的列名将成为结果表的列名,第二个表的内容将合并到相同数据类型的结果列中。
语法
以下是 MySQL 中 UNION 运算符的语法 -
SELECT * FROM table1 UNION SELECT * FROM table2;
示例
首先,我们创建两个表"COURSES_PICKED"和"EXTRA_COURSES_PICKED",它们的列数相同,数据类型也相同。
使用以下查询创建表 COURSES_PICKED -
CREATE TABLE COURSES_PICKED( STUDENT_ID INT NOT NULL, STUDENT_NAME VARCHAR(30) NOT NULL, COURSE_NAME VARCHAR(30) NOT NULL );
借助下面给出的查询将值插入到 COURSES_PICKED 表中 -
INSERT INTO COURSES_PICKED VALUES (1, 'JOHN', 'ENGLISH'), (2, 'ROBERT', 'COMPUTER SCIENCE'), (3, 'SASHA', 'COMMUNICATIONS'), (4, 'JULIAN', 'MATHEMATICS');
使用以下查询创建表 EXTRA_COURSES_PICKED -
CREATE TABLE EXTRA_COURSES_PICKED( STUDENT_ID INT NOT NULL, STUDENT_NAME VARCHAR(30) NOT NULL, EXTRA_COURSE_NAME VARCHAR(30) NOT NULL );
以下查询用于将值插入到 EXTRA_COURSES_PICKED 表中 -
INSERT INTO EXTRA_COURSES_PICKED VALUES (1, 'JOHN', 'PHYSICAL EDUCATION'), (2, 'ROBERT', 'GYM'), (3, 'SASHA', 'FILM'), (4, 'JULIAN', 'PHOTOGRAPHY');
现在,让我们使用 UNION 查询将这两个表合并起来,如下所示 -
SELECT * FROM COURSES_PICKED UNION SELECT * FROM EXTRA_COURSES_PICKED;
输出
执行 UNION 操作后得到的结果表为 -
STUDENT_ID | STUDENT_NAME | COURSE_NAME |
---|---|---|
1 | John | English |
1 | John | Physical Education |
2 | Robert | Computer Science |
2 | Robert | Gym |
3 | Sasha | Communications |
3 | Sasha | Film |
4 | Julian | Mathematics |
4 | Julian | Photography |
JOIN 的工作原理
JOIN 操作用于根据多个关联表的公共字段,将信息合并为一个。
在此操作中,第一个表的每一行将与第二个表的每一行合并。得到的结果表将包含两个表中的行。此操作可以与各种子句一起使用,例如 ON、WHERE、ORDER BY、GROUP BY 等。
JOIN 有两种类型:
- 内连接
- 外连接
基本的连接类型是内连接,它仅检索公共列的匹配值。它是默认连接。其他连接,例如交叉连接、自然连接、条件连接等,都属于内连接的类型。
外连接在结果表中同时包含第一个表中匹配和不匹配的行。它分为左连接、右连接和全连接等子类型。
尽管连接操作可以合并多个表,但连接两个表的最简单方法是不使用除 ON 子句之外的任何其他子句。
语法
以下是连接操作的基本语法 -
SELECT column_name(s) FROM table1 JOIN table2 ON table1.common_field = table2.common_field;
示例
在下面的示例中,我们将尝试使用以下查询连接上面创建的相同表,即 COURSES_PICKED 和 EXTRA_COURSES_PICKED -
mysql> SELECT c.STUDENT_ID, c.STUDENT_NAME, COURSE_NAME, COURSES_PICKED FROM COURSES_PICKED c JOIN EXTRA_COURSES_PICKED e ON c.STUDENT_ID = e.STUDENT_ID;
输出
结果表如下所示 −
STUDENT_ID | STUDENT_NAME | COURSE_NAME | COURSE_PICKED |
---|---|---|---|
1 | John | ENGLISH | Physical Education |
2 | Robert | COMPUTER SCIENCE | Gym |
3 | Sasha | COMMUNICATIONS | Film |
4 | Julian | MATHEMATICS | Photography |
UNION 与 JOIN
正如我们在上面给出的示例中所见,UNION 运算符只能在兼容并集的表上执行,而 JOIN 运算符可以连接两个不必兼容但应该相关的表。
让我们总结一下这些查询之间的所有区别 -
UNION | JOIN |
---|---|
UNION 操作只能在兼容并集的表上执行,即,表必须包含相同数量的列和相同的数据类型。 | JOIN 操作可以在至少有一个公共字段的表上执行。表格无需兼容并集。 |
合并后的数据将作为新行添加到结果表中。 | 合并后的数据将作为新列添加到结果表中。 |
这相当于连接操作。 | 这相当于一个交集操作。 |
UNION 会从结果表中删除所有重复值。 | JOIN 会保留两个表中的所有值,即使它们是多余的。 |
UNION 不需要任何附加子句来合并两个表。 | JOIN 需要一个附加子句 ON 来基于公共字段合并两个表。 |
它主要用于诸如将组织中的旧员工列表与新员工列表合并之类的场景。 | 这用于需要合并相关表的场景。例如,合并包含客户列表及其订单的表。 |