NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 交集

NumPy 中的交集

在 NumPy 中,"交集"是指两个或多个数组之间共有的元素。

NumPy 提供了一个名为 numpy.intersect1d() 的内置函数,用于查找两个数组之间的交集。

什么是数组交集?

使用数组时,您可能经常需要查找同时出现在两个数组中的元素。这个过程称为求交集。

例如,如果您有两组数字,并且需要确定哪些数字同时出现在两组中,则可以执行交集运算。

NumPy intersect1d() 函数

在 NumPy 中,intersect1d() 函数用于求两个一维数组的交集,如果需要,甚至可以求多个数组的交集。

以下是 NumPy intersect1d() 函数的基本语法。它的工作原理是比较两个输入数组并返回包含公共元素的数组 -

numpy.intersect1d(ar1, ar2, assume_unique=False, return_indices=False)

其中,

  • ar1, ar2:这两个输入数组是我们想要查找公共元素的。
  • assume_unique:如果设置为 True,则假定两个输入数组都只包含唯一元素,从而加快计算速度。
  • return_indices:如果设置为 True,则该函数不仅返回交集元素,还返回它们在原始数组中的索引数组。

示例

在下面的示例中,我们使用 numpy.intersect1d() 函数查找两个数组之间的共同元素 -

import numpy as np

# 定义两个数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])

# 求两个数组的交集
intersection = np.intersect1d(array1, array2)

print("array1 与 array2 的交集:", intersection)

以下是得到的结果 -

array1 与 array2 的交集:[4 5]

假设元素唯一以加快计算速度

如果您确定输入数组仅包含唯一元素(即无重复元素),则可以将 True 传递给 assume_unique 参数。这样可以避免检查重复元素,从而加快计算速度:

示例

与上例一样,交集保持不变,但由于假设了唯一性,该函数效率更高 -

import numpy as np

# 定义两个包含唯一元素的数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])

# 假设元素唯一,求交集
intersection = np.intersect1d(array1, array2, assume_unique=True)

print("假设元素唯一,求交集:", intersect)

输出结果如下:

假设元素唯一,求交集:[4 5]

返回交集元素的索引

除了返回交集元素之外,numpy.intersect1d() 函数还可以返回这些元素在输入数组中的索引。

当你想知道原始数组中的公共元素。为此,请将 return_indices 参数设置为 True

示例

在此示例中,交集元素 4 和 5 分别出现在 array1 中的索引 3 和 4 处以及 array2 中的索引 0 和 1 处 -

import numpy as np

# 定义两个数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])

# 查找交集并返回索引
intersection, indices1, indices2 = np.intersect1d(array1, array2, return_indices=True)

print("交集元素:", intersection)
print("数组1中的索引:", indices1)
print("数组2中的索引:", indices2)

执行上述代码后,我们得到以下输出 -

交集元素:[4 5]
数组1中的索引:[3 4]
数组2中的索引:[0 1]

多个元素的交集数组

numpy.intersect1d() 函数也可用于求两个以上数组的交集。

虽然该函数本身设计用于同时处理两个数组,但您可以使用循环或 functools 模块中的 reduce() 函数轻松将其扩展为处理多个数组。

示例

如下例所示,三个数组的公共元素为 5,因此构成了交集 -

import numpy as np
from functools import reduce

# 定义多个数组
array1 = np.array([1, 2, 3, 4, 5])
array2 = np.array([4, 5, 6, 7, 8])
array3 = np.array([5, 6, 7, 8, 9])

# 求所有数组的交集
intersection = reduce(np.intersect1d, [array1, array2, array3])

print("多个数组的交集:", intersection)

结果如下:-

多个数组的交集:[5]

处理不同数据类型的数组

NumPy 的 intersect1d() 函数也可以处理不同数据类型的数组,例如整数、浮点数和字符串。

但是,该函数会根据元素的数据类型进行比较,这意味着它会执行类型敏感的比较匹配。

示例

在此示例中,交集元素 4 以浮点数形式返回,因为第一个数组包含浮点数 -

import numpy as np

# 定义具有不同数据类型的数组
array1 = np.array([1.0, 2.0, 3.0, 4.0])
array2 = np.array([4, 5, 6, 7])

# 查找交集元素
intersection = np.intersect1d(array1, array2)

print("交集元素:", intersection)

输出结果如下 -

交集元素: [4.]

处理浮点精度问题

处理浮点数时,可能会出现精度问题,尤其是当值彼此非常接近但由于浮点运算的方式而不完全相同时。为了避免这种情况,您可以在执行交集运算之前对数组进行四舍五入。

示例

通过将数组四舍五入到小数点后两位,交集运算可以更精确地计算,即使浮点数差异很小,如下例所示 -

import numpy as np

# 定义浮点数组
array1 = np.array([1.234, 2.345, 3.456, 4.567])
array2 = np.array([4.567, 5.678, 6.789])

# 对数组进行四舍五入并求交集
array1_rounded = np.round(array1, 2)
array2_rounded = np.round(array2, 2)

intersection = np.intersect1d(array1_rounded, array2_rounded)

print("四舍五入后的交集:", Intersection)

输出结果如下 -

四舍五入后的交集:[4.57]