NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 奇异值分解

什么是奇异值分解 (SVD)?

奇异值分解,通常缩写为 SVD,是线性代数中的一种矩阵分解技术。奇异值分解 (SVD) 将一个矩阵分解为三个矩阵,从而保留原始矩阵的重要属性。

例如,假设有一个矩阵 A,其奇异值分解 (SVD) 公式为 −

A = UVT

其中,UV 是正交矩阵, 是对角矩阵。

U 的列称为左奇异向量,V 的列(或 VT 的行)称为右奇异向量, 的元素称为奇异值。

NumPy 中的 SVD

NumPy 提供了numpy.linalg.svd() 函数用于计算矩阵的奇异值分解。让我们通过一个示例来了解如何使用此函数。

示例

在本例中,矩阵 A 被分解为三个矩阵:U(表示为奇异值数组 S)和 VT

import numpy as np

# 定义一个 3x3 矩阵
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# 计算奇异值分解
U, S, VT = np.linalg.svd(A)

print("矩阵 U:
", U)
print("奇异值:", S)
print("矩阵 V^T:
", VT)

以下是得到的输出 −

矩阵 U:
[[-0.21483724 0.88723069 0.40824829]
[-0.52058739 0.24964395 -0.81649658]
[-0.82633754 -0.38794278 0.40824829]]
奇异值: [1.68481034e+01 1.06836951e+00 4.41842475e-16]
矩阵 V^T:
[[-0.47967118 -0.57236779 -0.66506441]
[-0.77669099 -0.07568647 0.62531805]
[-0.40824829 0.81649658 -0.40824829]]

理解分量

SVD 分量具有特定的属性和作用,如下所示 -

  • 矩阵 U:U 的列是 A 的左奇异向量。这些向量构成了A列空间的正交基。
  • 奇异值:的对角线元素是A的奇异值。这些值给出了A沿相应奇异向量作用的大小。
  • 矩阵VT:VT的行是A的右奇异向量。这些向量构成了A行空间的正交基。

重建原始矩阵

您可以从原始矩阵A的SVD分量重建其奇异值分解(SVD)分量。在 NumPy 中,你可以使用 numpy.dot() 函数执行矩阵乘法来实现这一点。

示例

在下面的示例中,我们重建原始矩阵"A" -

import numpy as np

# 定义一个 3x3 矩阵
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

# 计算奇异值分解
U, S, VT = np.linalg.svd(A)

# 根据奇异值创建对角矩阵
Sigma = np.zeros((3, 3))
np.fill_diagonal(Sigma, S)

# 重建原始矩阵
A_reconstructed = np.dot(U, np.dot(Sigma, VT))

print("原始矩阵:
", A)
print("重建矩阵:
", A_reconstructed)

原始矩阵 A 已成功使用其奇异值分解 (SVD) 分量重建,证明了分解的准确性 −/p>

原始矩阵:
[[1 2 3]
[4 5 6]
[7 8 9]]
重构矩阵:
[[1. 2. 3.]
[4. 5. 6.]
[7. 8. 9.]]

SVD 的应用

SVD 是一个功能强大的工具,具有多种应用,例如 -

  • 降维:在数据分析和机器学习中,奇异值分解 (SVD) 用于在保留重要信息的同时减少维度。
  • 图像压缩:SVD 用于压缩图像,从而减少存储图像所需的数据量。
  • 降噪:SVD 可以通过识别和丢弃较小的奇异值来消除数据中的噪声。
  • 信号处理:在信号处理中,SVD 用于分析和过滤信号。
  • 推荐系统:推荐系统中使用 SVD 来预测用户偏好。

示例:使用 SVD 进行图像压缩

让我们看一个如何使用 SVD 进行图像压缩的示例。我们将使用一张灰度图像,并通过仅保留最重要的奇异值来对其进行压缩 -

import numpy as np
import matplotlib.pyplot as plt
from skimage import data, color

# 加载示例图像并将其转换为灰度图像
image = color.rgb2gray(data.astronaut())
# 计算奇异值分解
U, S, VT = np.linalg.svd(image, full_matrices=False)

# 仅保留前 k 个奇异值
k = 50
U_k = U[:, :k]
S_k = np.diag(S[:k])
VT_k = VT[:k, :]

# 重建压缩图像
image_compressed = np.dot(U_k, np.dot(S_k, VT_k))

# 绘制原始图像和压缩图像
plt.figure(figsize=(10, 5))

plt.subplot(1, 2, 1)
plt.title("原始图像")
plt.imshow(image, cmap='gray')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.title(f"k={k} 的压缩图像")
plt.imshow(image_compressed, cmap='gray')
plt.axis('off')

plt.show()

原始图像和压缩图像并排显示,展示了 SVD 如何在保留图像基本特征的同时减小图像尺寸 -

SVD压缩

SVD 的优势

SVD 具有多种优势,例如:-

  • 数值稳定性:SVD 具有数值稳定性,可以处理病态矩阵。
  • 最佳低秩近似:SVD 提供矩阵的最佳低秩近似,使其成为降维的理想选择。
  • 稳健性:SVD 对数据中的微小扰动具有稳健性。
  • 多功能性:SVD 可以应用于任何矩阵,无论其性质如何。