NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 平均值

什么是平均值?

在数学中,平均值是一组数字的平均值。最常见的类型是算术平均值,即数字之和除以数字的数量。

其他类型包括几何平均值(数字乘积的 n 次方根)和调和平均值(数值的数量除以倒数之和)。

这些不同的平均值是根据数据的性质和分析的具体需求而使用的。

NumPy mean() 函数

NumPy 中的 mean() 函数计算数组中元素的算术平均值(平均值)。默认情况下,它会计算所有元素的平均值,但您可以指定一个轴来计算沿行或列的平均值。

它还可以处理不同的数据类型,并允许您定义输出类型。例如,np.mean([1, 2, 3, 4]) 返回 2.5。

以下是 NumPy 中 mean() 函数的基本语法 -

numpy.mean(a, axis=None, dtype=None, out=None, keepdims=False)

其中:

  • a: 包含要计算平均值的元素的输入数组。
  • axis: 计算平均值的轴。如果为 None,则计算数组中所有元素的平均值。对于多维数组,您可以指定一个轴(0 表示行,1 表示列,等等)。
  • dtype: 用于计算平均值的数据类型。如果未指定,则默认为输入数组的数据类型。
  • out: 存储结果的位置。如果提供,则必须与预期输出的形状和类型相同。
  • keepdims: 如果为 True,则缩小的轴将保留在结果中,作为大小为 1 的维度。这对于广播很有用。

计算一维数组的平均值

如果您有一个一维数组,您可以使用 numpy.mean() 函数计算其元素的平均值。以下是示例 -

import numpy as np

# 定义一个一维数组
arr = np.array([1, 2, 3, 4, 5])

# 计算所有元素的平均值
mean_value = np.mean(arr)

print("数组平均值:", mean_value)

以下是得到的输出 -

数组平均值:3.0

二维数组中沿特定轴的平均值

在二维数组中,可以计算沿特定轴的平均值。例如,计算沿行或列的平均值 -

import numpy as np

# 定义一个二维数组
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 沿行计算平均值 (axis=1)
mean_rows = np.mean(arr_2d, axis=1)

# 沿列计算平均值 (axis=0)
mean_columns = np.mean(arr_2d, axis=0)

print("沿行计算平均值:", mean_rows)
print("沿列计算平均值:", mean_columns)

以下是得到的输出 -

沿行计算平均值:[2. 5. 8.]
沿列计算平均值:[4. 5. 6.]

使用指定数据类型计算平均值

您还可以指定要计算平均值的数据类型。这在处理大数或需要特定精度的结果(例如 float64)时尤其有用。以下是示例 -

import numpy as np

# 定义一个整数数组
arr_int = np.array([10, 20, 30])

# 使用指定数据类型 (float64) 计算平均值
mean_float = np.mean(arr_int, dtype=np.float64)

print("float64 数据类型的平均值:", mean_float)

以下是得到的输出 -

float64 数据类型的平均值: 20.0

使用 Keepdims 参数计算平均值

keepdims 参数有助于在均值运算后保留原始数组的维数。如果设置为 True,结果将与输入数组具有相同的维数,但缩减后的轴的大小为 1。

import numpy as np

# 定义一个二维数组
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 沿列求均值,同时保持维度不变
mean_keepdims = np.mean(arr_2d, axis=0, keepdims=True)

print("keepdims=True 时的均值:", mean_keepdims)

以下是得到的输出 −

keepdims=True 时的均值: [[4. 5. 6.]]

NumPy 均值的应用

numpy.mean() 函数在科学计算、数据分析和机器学习领域有着广泛的应用。一些常见的用例如下:

  • 计算数据集中的平均值:平均值为数据集提供了一个中心值,这在统计和数据分析中对于理解数据分布至关重要。
  • 特征缩放:在机器学习中,计算特征的平均值有助于规范化和标准化,确保每个特征对模型的贡献相同。
  • 财务分析:计算财务数据(例如股票价格或销售数据)的平均值有助于识别趋势并做出明智的决策。
  • 科学测量:平均值在科学研究中用于汇总实验数据,提供集中趋势的度量。

优化平均值计算

NumPy 针对快速数组操作进行了优化,并且 numpy.mean() 函数非常高效。不过,有几种方法可以进一步优化平均值计算 −

  • 使用 out 参数: 如果要将平均值结果存储在预先存在的数组中,可以使用 out 参数,这样可以避免创建新数组并节省内存。
  • 明智地使用 axis: 仅在必要时指定轴。默认情况下,计算整个数组的平均值是最快的操作,但根据数据的不同,沿特定轴计算平均值可能会更慢。