NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 统计函数

NumPy 中的统计函数

NumPy 提供了丰富的统计函数,可用于对数组执行各种统计计算。这些函数可以计算平均值、中位数、方差、标准差、最小值、最大值等指标。

NumPy 的 amin() 和 amax() 函数

numpy.amin() 函数返回给定数组中沿指定轴的元素的最小值。而 numpy.amax() 函数则返回给定数组中沿指定轴的元素的最大值。

示例

以下示例演示了如何在 NumPy 数组上使用 amin() 和 amax() 函数 -

import numpy as np
a = np.array([[3,7,5],[8,4,3],[2,4,9]])

print('我们的数组是:')
print(a)
print('
')

print('调用 amin() 函数:')
print(np.amin(a,1))
print('
')

print('再次调用 amin() 函数:')
print(np.amin(a,0))
print('
')

print('调用 amax() 函数:')
print(np.amax(a))
print('
')

print('再次调用 amax() 函数:')
print(np.amax(a, axis=0))

它将产生以下输出 -

我们的数组是:
[[3 7 5]
[8 4 3]
[2 4 9]]
调用 amin() 函数:[3 3 2]
再次调用 amin() 函数:[2 4 3]
调用 amax() 函数:9
再次调用 amax() 函数:[8 7 9]

numpy.ptp() 函数

numpy.ptp() 函数返回范围(最大值 -沿轴计算值的最小值。

示例

在下面的示例中,我们使用 ptp() 函数计算 NumPy 数组中值的范围 -

import numpy as np
a = np.array([[3,7,5],[8,4,3],[2,4,9]])

print('我们的数组是:')
print(a)
print('
')

print('调用 ptp() 函数:')
print(np.ptp(a))
print('
')

print('沿轴 1 调用 ptp() 函数:')
print(np.ptp(a, axis=1))
print('
')

print('调用沿轴 0 调用 ptp() 函数:')
print(np.ptp(a, axis=0))

以下是得到的输出 −

我们的数组是:
[[3 7 5]
[8 4 3]
[2 4 9]]
调用 ptp() 函数:7
沿轴 1 调用 ptp() 函数:[4 5 7]
沿轴 0 调用 ptp() 函数:[6 3 6]

numpy.percentile() 函数

百分位数(或百分位数)是统计学中使用的一种度量,表示一组观测值中给定百分比的观测值低于该值。

numpy.percentile() 函数计算数据沿指定轴的第 q 个百分位数。它采用以下参数 -

numpy.percentile(a, q, axis)

其中:

  • a: 输入数组。
  • q: 需要计算的百分位数,必须介于 0-100 之间。
  • axis: 计算百分位数的轴。

示例

在此示例中,我们使用 percentile() 函数计算 NumPy 数组的第 50 个百分位数(中位数)-

import numpy as np
a = np.array([[30,40,70],[80,20,10],[50,90,60]])

print('我们的数组是:')
print(a)
print('
')

print('调用 percentile() 函数:')
print(np.percentile(a,50))
print('
')

print('沿轴 1 调用 percentile() 函数:')
print(np.percentile(a,50, axis=1))
print('
')

print('沿轴 0 调用 percentile() 函数:')
print(np.percentile(a,50, axis=0))

这将产生以下结果 -

我们的数组是:
[[30 40 70]
[80 20 10]
[50 90 60]]
调用 percentile() 函数:50.0
沿轴 1 调用 percentile() 函数:[40. 20. 60.]
沿轴 0 应用 percentile() 函数:[50. 40. 60.]

数组元素的和与积

numpy.sum() 函数计算数组中所有元素的和,而 numpy.prod() 函数计算数组中所有元素的乘积。

示例

在下面的示例中,我们使用 sum() 和 prod() 函数计算 NumPy 数组中元素的和与乘积 -

import numpy as np 

# 创建一个 NumPy 数组
data = np.array([1, 2, 3, 4])

# 计算数组的和
sum_value = np.sum(data)

# 计算数组的乘积
prod_value = np.prod(data)

print(f"数组的和:{sum_value}")
print(f"数组的乘积:{prod_value}")

它将产生以下输出 -

数组的和:10
数组的乘积:24

numpy.median() 函数

numpy.median() 函数计算沿指定轴的中位数。如果未指定轴,则计算展平数组的中位数。中位数定义为分隔数据样本上半部分和下半部分的值。

示例

在下面的示例中,我们使用 median() 函数查找 NumPy 数组中元素的中位数 -

import numpy as np
a = np.array([[30,65,70],[80,95,10],[50,90,60]])

print('我们的数组是:')
print(a)
print('
')

print('调用 median() 函数:')
print(np.median(a))
print('
')

print('沿轴 0 调用 median() 函数:')
print(np.median(a, axis=0))
print('
')

print('沿轴 1 调用 median() 函数:')
print(np.median(a, axis=1))

以下是上述代码的输出 -

我们的数组是:
[[30 65 70]
[80 95 10]
[50 90 60]]
调用 median() 函数:65.0
沿轴 0 调用 median() 函数:[50. 90. 60.]
沿轴 1 调用 median() 函数:[65. 80. 60.]

numpy.mean() 函数

numpy.mean() 函数返回数组中元素的算术平均值。如果没有指定轴,则计算扁平数组的平均值。算术平均值是沿某个轴的元素之和除以元素数量。

示例

在下面的示例中,我们使用 mean() 函数计算 NumPy 数组中元素的平均值 -

import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])

print('我们的数组是:')
print(a)
print('
')

print('调用 mean() 函数:')
print(np.mean(a))
print('
')

print('沿 0 轴调用 mean() 函数:')
print(np.mean(a, axis=0))
print('
')

print('沿轴 1 应用 mean() 函数:')
print(np.mean(a, axis=1))

得到的输出如下所示 -

我们的数组是:
[[1 2 3]
[3 4 5]
[4 5 6]]
应用 mean() 函数:3.666666666666665
沿轴 0 应用 mean() 函数:[2.66666667 3.66666667 4.66666667]
沿轴 1 应用 mean() 函数:[2. 4. 5.]

numpy.average() 函数

numpy.average() 函数根据数组中元素各自的权重计算它们的加权平均值。加权平均值是将每个元素乘以一个因子得到的平均值。

示例

在下面的示例中,我们使用 average() 函数(带权重和不带权重)计算 NumPy 数组中元素的平均值 -

import numpy as np 
a = np.array([1,2,3,4]) 

print('我们的数组是:')
print(a)
print('
')

print('不带权重调用 average() 函数:')
print(np.average(a))
print('
')

wts = np.array([4,3,2,1])

print('带权重调用 average() 函数:')
print(np.average(a,weights=wts))
print('
')

print('权重总和')
print(np.average([1,2,3,4],weights=[4,3,2,1], returned=True))

它将产生以下输出 −

我们的数组是:[1 2 3 4]
不带权重调用 average() 函数:2.5
调用 average()带权重的函数:2.0
权重和 (2.0, 10.0)

numpy.std() 函数

numpy.std() 函数返回数组中元素的标准差。 标准差是与均值的平方差的平均值的平方根,即 std = sqrt(mean(abs(x - x.mean())**2))。

示例

在下面的示例中,我们使用 std() 函数计算 NumPy 数组的标准差 -

import numpy as np
print(np.std([1,2,3,4]))

执行上述代码后,我们得到以下输出 -

1.118033988749895

numpy.var() 函数

numpy.var() 函数返回数组中元素的方差。方差是方差的平均值,即 var = mean(abs(x - x.mean())**2)。

示例

在以下示例中,我们使用 var() 函数计算 NumPy 数组的方差 -

import numpy as np
print(np.var([1,2,3,4]))

我们得到如下所示的输出 -

1.25

相关系数

numpy.corrcoef() 函数返回输入数组的皮尔逊相关系数。它对于确定两个变量之间的关系非常有用。

示例

在下面的示例中,我们使用 corrcoef() 函数计算两个数组的相关系数矩阵 -

import numpy as np

# 定义两个数组
data1 = np.array([1, 2, 3, 4, 5])
data2 = np.array([5, 4, 3, 2, 1])

# 计算相关系数
corr_coef = np.corrcoef(data1, data2)

print("相关系数矩阵:")
print(corr_coef)

结果如下所示 -

相关系数矩阵:
[[ 1. -1.]
[-1. 1.]]

统计函数

以下是 Numpy 中不同的统计函数 -

序号 函数及说明
1 amin()

返回数组的最小值或沿某个轴的最小值

2 amax()

返回数组的最大值或沿某个轴的最大值

3 nanmin()

返回数组的最小值或沿某个轴的最小值,忽略任何 NaN

4 nanmax()

返回数组的最大值或沿某个轴的最大值,忽略任何 NaN

5 ptp()

沿某个轴的值范围(最大值 - 最小值)

6 percentile()

计算数据沿指定轴的第 q 个百分位数

7 nanpercentile()

计算数据沿指定轴的第 q 个百分位数,同时忽略 nan 值

8 quantile()

计算数据沿指定轴的第 q 个分位数

9 nanquantile()

计算数据沿指定轴的第 q 个分位数指定的轴,同时忽略 nan 值。返回数组元素的第 q 个分位数

10 median()

沿指定轴计算中位数

11 average()

沿指定轴计算加权平均值

12 mean()

沿指定轴

13 std()

计算指定轴的标准差

14 var()

计算指定轴的方差

15 nanmean()

计算指定轴的算术平均值,忽略NaN

16 nanstd()

计算指定轴的标准差,同时忽略 NaN

17 nanvar()

计算指定轴的方差,同时忽略 NaN