NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 副本与视图

在 NumPy 中,对数组执行操作时,结果可能是原始数据的副本,也可能只是原始数据的视图。了解两者之间的区别对于高效的内存管理和避免代码中出现意外的副作用至关重要。

在 NumPy 中创建副本

我们可以使用 copy() 函数在 NumPy 中显式创建数组的副本。此函数会生成一个新数组,并将原始数组中的数据复制到这个新数组中。

在 NumPy 中创建数组副本时,数据会被完全复制。这意味着对副本所做的更改不会影响原始数组,反之亦然。当您需要处理数组的修改版本而不更改原始数据时,副本非常有用。

示例

在以下示例中,修改 copied_array 不会影响 original_array,从而证明了两个数组的独立性 -

import numpy as np

# 原始数组
original_array = np.array([1, 2, 3])

# 创建副本
copied_array = original_array.copy()

# 修改副本
copied_array[0] = 10

print("原始数组:", original_array)
print("复制的数组:", duplicated_array)

以下是获得的输出−

原始数组:[1 2 3]
复制后的数组:[10 2 3]

浅拷贝 vs. 深拷贝

在 NumPy 数组的语境中,浅拷贝和深拷贝之间的区别对于理解数据在复制时的处理方式至关重要。

浅拷贝

数组的浅拷贝会创建一个新的数组对象,但如果原始数组中的元素本身是数组或其他复杂对象,则不会创建这些元素的副本。

相反,新数组仍然引用与原始数组相同的元素。这意味着对元素内容的更改将同时影响原始数组和复制的数组。

  • 数组级复制 − 对于 NumPy 数组,浅拷贝意味着虽然复制了顶层数组对象,但不会复制底层数据缓冲区。新数组只是相同数据的新视图。
  • 用法 - 当您需要一个新的数组对象,但又想避免复制大量数据的开销时,浅拷贝非常有用。

示例

在此示例中,修改 shallow_copy 也会修改 original_array,因为它们共享相同的底层数据 -

import numpy as np

# 原始数组
original_array = np.array([[1, 2, 3], [4, 5, 6]])

# 浅拷贝
shallow_copy = original_array.view()

# 修改浅拷贝中的元素
shallow_copy[0, 0] = 100

print("原始数组:")
print(original_array)

print("
浅拷贝:")
print(shallow_copy)

这将产生以下结果 -

原始数组:
[[100 2 3]
[ 4 5 6]]

浅拷贝:
[[100 2 3]
[ 4 5 6]]

深拷贝

另一方面,深拷贝会创建一个新的数组对象,并复制其包含的所有数据。这意味着对新数组的任何更改都不会影响原始数组,反之亦然。新数组中的数据与原始数组中的数据完全独立。

  • 完全复制 − 在 NumPy 中,深层复制涉及复制数组的整个数据缓冲区,以确保新数组与原始数组完全独立。
  • 用法 − 当你需要独立于原始数组处理数据时,深层复制非常重要,尤其是在修改数据时不会影响原始数组。

示例

在本例中,修改 deep_copy 不会影响 original_array,从而证明了两个数组的独立性 −

import numpy as np

# 原始数组
original_array = np.array([[1, 2, 3], [4, 5, 6]])

# 深层复制
deep_copy = original_array.copy()

# 修改深层复制中的元素
deep_copy[0, 0] = 100

print("原始数组:")
print(original_array)

print("
深层复制:")
print(deep_copy)

以下是上述代码的输出 -

原始数组:
[[1 2 3]
[4 5 6]]

深层复制:
[[100 2 3]
[ 4 5 6]]

复制子数组

为了避免在处理子数组时修改原始数组,您应该创建子数组。当您需要独立于原始数据操作或分析子数组时,这非常有用。

子数组只是现有 NumPy 数组的一部分。您可以使用切片技术提取子数组。

例如,如果您有一个二维数组,您可以通过沿其行和列进行切片来提取一个较小的二维子数组。但是,默认情况下,切片会创建原始数组的视图,而不是单独的副本。这意味着,除非您明确创建副本,否则对子数组的更改也会影响原始数组。

示例

在下面的示例中,由于使用了 copy() 函数,sub_array 是一个完全独立的数组 -

import numpy as np

# 原始二维数组
original_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 创建子数组的副本
sub_array = original_array[0:2].copy()
sub_array[0] = 20

print("复制子数组后的原始数组:", original_array)
print("子数组:", sub_array)

得到的输出如下所示 -

复制子数组后的原始数组:
[[1 2 3]
[4 5 6]
[7 8 9]]
子数组:
[[20 20 20]
[ 4 5 6]]

在 NumPy 中创建视图

视图是在对数组进行切片或执行某些操作(例如重塑)时创建的。数据不会被复制;相反,新数组只是查看原始数据的另一种方式。

换句话说,视图是一个新的数组对象,它查看与原始数组相同的数据。这意味着,如果您修改视图,更改将反映在原始数组中,反之亦然。

示例

在此示例中,修改 view_array 会直接影响 original_array,表明它们共享相同的数据 -

import numpy as np

# 原始数组
original_array = np.array([1, 2, 3])

view_array = original_array[0:2]

# 修改视图
view_array[0] = 30

print("视图修改后的原始数组:", original_array)
print("视图数组:", view_array)

执行上述代码后,我们得到以下输出 -

视图修改后的原始数组:[30 2 3]
视图数组:[30 2]

何时返回视图?

并非所有切片或操作都会生成视图。如果数组的内存布局发生变化,NumPy 可能会返回副本而不是视图。

切片生成的视图

NumPy 中返回视图的最常见场景是对数组进行切片。切片是一种通过指定索引范围来提取数组一部分的方法。NumPy 不会创建一个包含自身数据的新数组,而是返回一个视图,这意味着切片后的数组与原始数组共享相同的数据。

示例

在此示例中,view_arrayoriginal_array 的视图。数据不会被复制,并且两个数组共享相同的底层内存。这意味着对"view_array"所做的任何更改都会影响"original_array" -

import numpy as np

# 原始数组
original_array = np.array([1, 2, 3, 4, 5])

# 通过切片原始数组创建视图
view_array = original_array[1:4]

print("原始数组:")
print(original_array)

print("
切片后的视图数组:")
print(view_array)

结果如下 -

原始数组:
[1 2 3 4 5]

切片后的视图数组:
[2 3 4]

来自重塑

另一种返回视图的常见场景是重塑数组。重塑会改变数组的形状(即每个维度的元素数量),而不会更改底层数据。如果可能,NumPy 会返回原始数组的新形状视图。

示例

此处,reshaped_arrayoriginal_array 的视图,以"2x3"格式简单呈现。数据保持不变,修改"reshaped_array"也会修改"original_array" -

import numpy as np

# 原始一维数组
original_array = np.array([1, 2, 3, 4, 5, 6])

# 将数组重塑为 2x3 矩阵
reshaped_array = original_array.reshape(2, 3)

print("原始数组:")
print(original_array)

print("
重塑后的数组(视图):")
print(reshaped_array)

我们得到如下所示的输出 -

原始数组:[1 2 3 4 5 6]
重塑后的数组(视图):
[[1 2 3]
[4 5 6]]

转置后的视图

转置数组涉及沿对角线翻转,将行转换为列,反之亦然。使用 np.transpose() 等函数或 .T 属性转置数组时,NumPy 会尽可能返回视图,而不是副本。

示例

在本例中,transposed_arrayoriginal_array 的视图,但轴方向已互换。底层数据保持不变,对"transposed_array"的更改将反映在"original_array"中 -

import numpy as np

# 原始二维数组
original_array = np.array([[1, 2, 3], [4, 5, 6]])

# 转置数组
transposed_array = original_array.T

print("原始数组:")
print(original_array)

print("
转置数组(视图):")
print(transposed_array)

以下是获得的输出 -

原始数组:
[[1 2 3]
[4 5 6]]

转置数组(视图):
[[1 4]
[2 5]
[3 6]]

Base 属性

在 NumPy 中,数组的 base 属性用于检查该数组是另一个数组的视图还是副本。它是对派生当前数组的原始数组的引用。

如果当前数组是另一个数组的视图,则 "base" 将指向该原始数组。如果当前数组不是视图(即,它是原始数组或深层副本),则 "base" 将为 None

示例:原始数组的 ba​​se 属性

创建数组时,其 base 属性将为 None,因为它是原始数组 -

import numpy as np

# 创建原始数组
original_array = np.array([10, 20, 30, 40, 50])

# 检查 base 属性
print("原始数组的 Base:", original_array.base)

这将产生以下结果 -

原始数组的 Base: None

示例:视图的 base 属性

创建数组的视图(例如,通过切片)时,视图的 base 属性将指向原始数组 -

import numpy as np

# 创建原始数组
original_array = np.array([10, 20, 30, 40, 50])

# 创建原始数组的视图
view_array = original_array[1:4]

# 检查 base 属性
print("视图数组的 Base:", view_array.base)

以下是上述代码的输出 -

视图数组的 Base: [10 20 30 40 50]

示例:副本的 base 属性

如果创建数组的副本,则 base 属性将为 None,表示复制的数组与原始数组无关 -

import numpy as np

# 创建原始数组
original_array = np.array([10, 20, 30, 40, 50])

# 创建原始数组的副本
copy_array = original_array.copy()

# 检查 base 属性
print("复制数组的 Base:", copy_array.base)

以下是上述代码的输出 -

复制数组的 Base: None