NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 使用日期时间进行索引

在 NumPy 中使用日期时间进行索引

在 NumPy 中使用日期时间进行索引,可以轻松选择和操作基于特定时间的数据。这在处理时间序列数据(例如股票价格或温度读数)时非常有用。

使用 NumPy 中的 datetime64 类型,您可以像数组一样对数据进行切片、过滤和索引。这使您可以专注于特定的时间段,例如特定的日期或日期范围,并执行诸如比较或过滤日期以进行分析之类的操作。

使用日期时间数组进行基本索引

在 NumPy 中使用日期时间数组进行索引和切片,可以轻松访问特定的日期或日期范围。您可以通过指定日期时间数组中单个日期的位置来对其进行索引,就像常规数组一样。

对于切片,您可以通过提供开始和结束索引来选择连续的日期范围。此外,NumPy 支持布尔索引,允许您根据条件过滤日期(例如,选择特定日期之后的所有日期)。

示例

在以下示例中,我们将对 datetime64 数组进行切片,以选择特定范围的日期 -

import numpy as np

# 定义一个 datetime 数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04', '2024-01-05'], dtype='datetime64[D]')

# 对 datetime 数组进行切片
selected_dates = dates[1:4]

print(selected_dates)

这将产生以下输出 -

['2024-01-02' '2024-01-03' '2024-01-04']

使用布尔索引进行过滤

NumPy 中的布尔索引允许您根据条件过滤数组中的元素。使用日期时间数组时,此功能对于选择特定时间范围内的数据或满足某些基于时间的条件非常有用。

要执行布尔索引,您需要创建一个与原始日期时间数组结构匹配的条件(布尔数组)。该条件可以是任何比较日期(或其他数据)的逻辑表达式,它将返回一个包含 True 或 False 值的数组。然后使用这些 True 值从原始数组中过滤出相应的元素。

示例

在此示例中,我们使用布尔索引过滤日期时间数组,仅选择特定日期之后的日期 -

import numpy as np

# 定义日期时间数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04', '2024-01-05'], dtype='datetime64[D]')

# 定义过滤条件
filtered_dates = dates[dates > np.datetime64('2024-01-02')]

print(filtered_dates)

此操作的输出为 −

['2024-01-03' '2024-01-04' '2024-01-05']

使用日期范围进行索引

在 NumPy 中使用日期范围进行索引允许您选择和处理特定时间间隔内的日期时间数据子集。

要使用日期范围进行索引,您需要定义一个条件,指定您感兴趣的范围的起始和终止日期。这可以使用比较运算符来过滤所需范围内的日期。您可以使用逻辑运算符组合条件,从而更精确地过滤数据。

示例

在此示例中,我们选择特定日期范围内的数据 -

import numpy as np

# 定义一个日期时间数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04', '2024-01-05'], dtype='datetime64[D]')

# 定义开始和结束日期
start_date = np.datetime64('2024-01-02')
end_date = np.datetime64('2024-01-04')

# 选择范围内的日期
range_dates = dates[(dates >= start_date) & (dates <= end_date)]

print(range_dates)

结果如下 -

['2024-01-02' '2024-01-03' '2024-01-04']

使用不同的时间单位

在 NumPy 中,datetime64 和 timedelta64 对象允许您使用从年到阿秒的各种时间单位。这有助于精确操作和分析不同尺度的时间数据,例如天、小时、分钟,甚至更小的单位,如纳秒或飞秒。

NumPy 中的时间单位用字符串表示,例如"Y"表示年,"M"表示月,"D"表示天,"h"表示小时,"m"表示分钟,"s"表示秒,"ms"表示毫秒,"us"表示微秒,"ns"表示纳秒。您可以使用这些单位创建 datetime 和 timedelta 对象,或执行涉及时间间隔的算术运算。

示例

在此示例中,我们将索引 datetime64 数组以选择特定月份内的日期 -

import numpy as np

# 定义一个 datetime 数组
dates = np.array(['2024-01-01', '2024-02-01', '2024-03-01', '2024-04-01'], dtype='datetime64[M]')

# 按一月过滤日期
january_dates = dates[dates == np.datetime64('2024-01', 'M')]

print(january_dates)

执行上述代码后,我们得到以下输出 -

['2024-01']

使用结构化数组进行高级索引

NumPy 中的结构化数组允许您存储和操作复杂数据,例如包含多个字段的记录,每个字段可以是不同类型的。

高级索引技术可帮助您访问和修改数据的特定字段或子集。结构化数组是使用 np.array() 函数创建的,该函数带有一个 dtype 参数,该参数指定字段的名称和类型。

NumPy 中的结构化数组类似于常规数组,但它允许每个元素包含多个字段,每个字段都有自己的数据类型。这些字段可以表示不同类型的数据,例如整数、浮点数或字符串,所有这些数据都组织在一个数组中。

示例

在此示例中,我们创建一个结构化数组并按日期对其进行索引,根据日期时间值选择特定记录 -

import numpy as np

# 定义一个包含日期和相​​关数据的结构化数组
data = np.array([('2024-01-01', 100), ('2024-01-02', 200), ('2024-01-03', 300)],
dtype=[('date', 'datetime64[D]'), ('value', 'i4')])

# 过滤日期晚于的数据'2024-01-01'
filtered_data = data[data['date'] > np.datetime64('2024-01-01')]

print(filtered_data)

输出结果为 −

[('2024-01-02', 200) ('2024-01-03', 300)]