NumPy - 并集

NumPy 中的并集

在 NumPy 中，"并集"是指将两个或多个数组的元素合并并删除重复值的操作。

它通常用于合并多个数据集或数组，以确保每个元素在最终结果中只出现一次。

NumPy 提供了 numpy.union1d() 函数，可以轻松求两个一维数组的并集。

什么是数组并集?

两个或多个数组的并集是指所有输入数组中唯一元素的组合。

这意味着结果中不存在重复元素。并集运算与数学中的集合概念密切相关。

例如，如果两个数组包含一些相同元素和一些唯一元素，则并集将包含两个数组中所有唯一元素。

NumPy union1d() 函数

在 NumPy 中，numpy.union1d() 函数用于计算两个一维数组的并集。此函数确保结果中没有重复的元素，即使两个输入数组中都出现了相同的元素。

以下是 NumPy union1d() 函数的基本语法 -

numpy.union1d(ar1, ar2)

其中，ar1 和 ar2 是需要求并集的两个输入数组。数组可以包含任何数据类型，并且它们可能有重叠元素，也可能没有。

示例

在以下示例中，我们使用 NumPy 中的 union1d() 函数计算两个数组的并集 -

import numpy as np

# 定义两个数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])

# 计算两个数组的并集
union = np.union1d(array1, array2)

print("array1 与 array2 的并集:", union)

如输出所示，array1 和array2 包含两个数组中所有不重复的元素，且不重复。数字 4 和 5 在两个数组中均出现，但在最终结果中仅出现一次 -

array1 和 array2 的并集:[1 2 3 4 5 6 7 8]

不同数据类型数组的并集

NumPy 的 union1d() 函数还可以处理不同数据类型的数组，例如整数、浮点数，甚至字符串。该函数会在计算并集之前将所有元素转换为通用类型。

示例

如下例所示，NumPy 自动将所有元素转换为浮点数，因为第一个数组包含浮点数，并且并集不包含重复项 -

import numpy as np

# 定义具有不同数据类型的数组
array1 = np.array([1, 2, 3, 4.5])
array2 = np.array([4.5, 5, 6, 7])

# 计算数组的并集
union = np.union1d(array1, array2)

print("不同类型的 array1 和 array2 的并集:", union)

结果如下 -

不同类型的数组 1 和数组 2 的并集:[1. 2. 3. 4.5 5. 6. 7.]

处理多个数组

numpy.union1d() 函数一次可处理两个数组。但是，如果需要计算两个以上数组的并集，可以使用循环或 functools 模块中的 reduce() 函数。

示例

以下示例演示了如何计算三个数组的并集 -

import numpy as np
from functools import reduce

# 定义多个数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])
array3 = np.array([7, 8, 9, 10])

# 求所有数组的并集
union = reduce(np.union1d, [array1, array2, array3])

print("多个数组的并集:", union)

如输出所示，并集操作将三个数组中所有不重复的元素合并在一起。没有重复项，并集包含数组中所有唯一值 -

多个数组的并集:[1 2 3 4 5 6 7 8 9 10]

包含重复项的数组的并集

当输入数组包含重复元素时，numpy.union1d() 会自动在最终结果中删除这些重复元素。这确保返回的并集仅包含唯一元素。

示例

以下示例查找包含重复元素的数组的并集 -

import numpy as np

# 定义包含重复元素的数组
array1 = np.array([1, 2, 2, 3, 4])
array2 = np.array([3, 4, 4, 5, 6])

# 求数组的并集
union = np.union1d(array1, array2)

print("Union with duplicates removed:", union)

输出结果如下所示 -

去除重复元素后的并集:[1 2 3 4 5 6]

数组与字符串的并集

在 NumPy 中，你还可以对包含字符串的数组执行并集运算。该函数将合并两个数组中所有不重复的字符串。

示例

我们来看一个字符串数组的示例 -

import numpy as np

# 定义字符串数组
array1 = np.array(['apple', 'banana', 'cherry'])
array2 = np.array(['banana', 'cherry', 'date'])

# 求字符串数组的并集
union = np.union1d(array1, array2)

print("字符串数组的并集:", union)

我们得到以下输出 -

字符串数组的并集:['apple' 'banana' 'cherry' 'date']

性能考虑

numpy.union1d() 函数效率较高，但性能取决于输入数组的大小。处理非常大的数组时，最好确保数组尽可能高效。

例如，如果数组只包含唯一元素，可以将 assume_unique 参数设置为 True 以加快并集操作:

示例

通过假设数组只包含唯一元素，NumPy 可以更快地执行并集操作，如下例所示 -

import numpy as np

# 定义包含唯一元素的数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([6, 7, 8, 9, 10])

# 假设元素唯一，求并集
union = np.union1d(array1, array2)

print("唯一数组的并集:", union)

结果如下 -

唯一数组的并集:[1 2 3 4 5 6 7 8 9 10]

NumPy 教程

数组

创建和操作数组

索引与切片

数组属性与操作

高级数组运算

排序和高级操作

处理缺失数据

性能优化

线性代数

元素级矩阵运算

集合运算

随机数生成

文件输入 &输出

数学函数

傅里叶变换

多项式

统计

日期时间函数

ufunc

实用资源

NumPy - 并集

NumPy 中的并集

什么是数组并集?

NumPy union1d() 函数

示例

不同数据类型数组的并集

示例

处理多个数组

示例

包含重复项的数组的并集

示例

数组与字符串的并集

示例

性能考虑

示例

颜色选择器

NUMPY 测验/考试

读后有收获微信请站长喝咖啡

错误报告

您的建议:

感谢您的帮助！