NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 日期时间的向量化运算

NumPy 日期时间的向量化运算

NumPy 中的向量化运算允许您对整个数据数组执行运算,而无需显式循环。

处理日期时间数据时,NumPy 的向量化运算使您能够一次性对整个日期时间值数组执行基于时间的计算,而无需手动迭代每个元素。

使用 datetime64 类型,您可以对日期时间数组执行各种算术和比较运算,例如加减时间间隔、比较日期或执行条件运算。

加减时间间隔

对日期时间数据最常见的运算之一是加减时间间隔。 NumPy 允许您以矢量化的方式执行这些操作,这意味着您可以一次性从整个日期时间值数组中添加或减去时间增量。

要添加或减去时间间隔,您可以使用 timedelta64 对象,它表示时间差。此对象可以添加到 datetime64 对象或从中减去,从而按指定的间隔移动日期或时间。

示例

在此示例中,我们将为 datetime 数组中的每个日期添加 5 天 -

import numpy as np

# 定义一个 datetime 数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03'], dtype='datetime64[D]')

# 定义一个 5 天的时间差
time_delta = np.timedelta64(5, 'D')

# 将时间差添加到 datetime 数组
new_dates = dates + time_delta

print(new_dates)

以下是得到的输出 -

['2024-01-06' '2024-01-07' '2024-01-08']

日期相减并计算差值

另一个常见操作是计算两个日期之间的差值,其结果是一个 timedelta64 对象。当您需要计算两个时间点之间的时间差(例如两个日期之间的天数)时,这非常有用。

在 NumPy 中,您可以将一个日期时间数组与另一个日期时间数组相减,得到一个时间差数组,表示数组中对应日期之间的差值。

示例

在此示例中,我们计算日期时间数组中两个日期之间的差值 -

import numpy as np

# 定义两个日期时间数组
dates1 = np.array(['2024-01-01', '2024-01-02', '2024-01-03'], dtype='datetime64[D]')
dates2 = np.array(['2024-01-04', '2024-01-05', '2024-01-06'], dtype='datetime64[D]')

# 将数组相减得到差值
time_diff = dates2 - dates1

print(time_diff)

输出将显示以天数为单位的差值 -

[3 3 3]

以向量化方式比较日期

NumPy 允许您在日期时间数组之间执行逐元素比较,从而让您能够根据时间条件过滤或分析数据。向量化比较运算可用于将日期时间值与固定时间点进行比较,或将日期时间值相互比较。

您可以使用标准比较运算符比较日期时间数组,例如 ><>=<===!=,这些运算符返回一个布尔值数组,指示每个元素是否满足条件。

示例

在此示例中,我们使用向量化比较来过滤大于特定日期的日期 -

import numpy as np

# 定义日期时间数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03'], dtype='datetime64[D]')

# 定义过滤条件(大于 '2024-01-02' 的日期)
filtered_dates = dates[dates > np.datetime64('2024-01-02')]

print(filtered_dates)

这将产生以下结果 -

['2024-01-03']

使用 Timedelta 数组进行矢量化运算

除了使用日期时间数组之外,您还可以使用 timedelta64 数组执行矢量化运算,这些数组表示日期时间值之间的差异。这些操作在处理持续时间或时间间隔时非常有用。

您可以对 timedelta 数组执行算术运算(例如加法或减法),以计算多个时间间隔之间的总持续时间,或者将它们与其他时间间隔进行比较。

示例

在此示例中,我们将两个 timedelta 数组相加以获取总持续时间 -

import numpy as np

# 定义两个 timedelta 数组
delta1 = np.array([np.timedelta64(5, 'D'), np.timedelta64(10, 'D')], dtype='timedelta64[D]')
delta2 = np.array([np.timedelta64(2, 'D'), np.timedelta64(3, 'D')], dtype='timedelta64[D]')

# 添加 timedelta 数组
total_delta = delta1 + delta2

print(total_delta)

以下是上述代码的输出 -

[ 7 13]

使用不同的时间单位

NumPy 支持多种时间单位,包括年、月、日、时、分和秒。您可以根据需要对跨不同时间单位的日期时间数组执行向量化操作。

这在处理跨越多个时间尺度的数据或需要在不同单位之间转换时尤其有用。

示例

在此示例中,我们使用具有不同时间单位的日期时间数组和时间增量数组 -

import numpy as np

# 定义日期时间数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03'], dtype='datetime64[D]')

# 定义包含小时数的时间增量数组
timedelta = np.array([np.timedelta64(10, 'h'), np.timedelta64(5, 'h'), np.timedelta64(20, 'h')])

# 将 timedelta 数组添加到 datetime 数组
new_dates = dates + timedelta

print(new_dates)

执行上述代码后,我们得到以下输出 -

['2024-01-01T10' '2024-01-02T05' '2024-01-03T20']