NumPy 教程

NumPy 首页 NumPy 简介 NumPy 环境

数组

NumPy Ndarray 对象 NumPy 数据类型

创建和操作数组

NumPy 数组创建例程 NumPy 数组操作 NumPy 基于现有数据创建数组 NumPy 基于数值范围创建数组 NumPy 数组迭代 NumPy 重塑数组 NumPy 连接数组 NumPy 堆叠数组 NumPy 拆分数组 NumPy 展平数组 NumPy 转置数组

索引与切片

NumPy 索引 &切片 NumPy 索引 NumPy 切片 NumPy 高级索引 NumPy 高级索引 NumPy 字段访问 NumPy 使用布尔数组切片

数组属性与操作

NumPy 数组属性 NumPy 数组形状 NumPy 数组大小 NumPy 数组步长 NumPy 数组元素大小 NumPy 广播 NumPy 算术运算 NumPy 数组加法 NumPy 数组减法 NumPy 数组乘法 NumPy 数组除法

高级数组运算

NumPy 交换数组的轴 NumPy 字节交换 NumPy 副本和视图 NumPy 逐元素数组比较 NumPy 过滤数组 NumPy 连接数组 NumPy 排序、搜索& 计数函数 NumPy 搜索数组 NumPy 数组并集 NumPy 查找唯一行 NumPy 创建日期时间数组 NumPy 二元运算符 NumPy 字符串函数 NumPy 矩阵库 NumPy 线性代数 NumPy Matplotlib NumPy 使用 Matplotlib 绘制直方图

排序和高级操作

NumPy 数组排序 NumPy 沿轴排序 NumPy 使用花式索引进行排序 NumPy 结构化数组 NumPy 创建结构化数组 NumPy 操作结构化数组 NumPy 记录数组 NumPy 加载数组 NumPy 保存数组 NumPy 将值附加到数组 NumPy 交换列数组 NumPy 将轴插入数组

处理缺失数据

NumPy 处理缺失数据 NumPy 识别缺失值 NumPy 移除缺失数据 NumPy 插补缺失值数据

性能优化

NumPy 使用数组进行性能优化

线性代数

NumPy 线性代数 NumPy 矩阵库 NumPy 矩阵加法 NumPy 矩阵减法 NumPy 矩阵乘法 NumPy 逐元素矩阵运算 NumPy 点积 NumPy 矩阵求逆 NumPy 行列式计算 NumPy 特征值 NumPy 特征向量 NumPy 奇异值分解 NumPy 求解线性方程 NumPy 矩阵范数

元素级矩阵运算

NumPy 总和 NumPy 平均值 NumPy 中位数 NumPy 最小值 NumPy 最大值

集合运算

NumPy 唯一元素 NumPy 交集 NumPy 并集 NumPy 差集

随机数生成

NumPy 随机数生成器 NumPy 排列和重排 NumPy 均匀分布 NumPy 正态分布 NumPy 二项分布 NumPy 泊松分布 NumPy 指数分布 NumPy 瑞利分布 NumPy 逻辑分布 NumPy 帕累托分布 NumPy 使用 Seaborn 可视化分布 NumPy 多项分布 NumPy 卡方分布 NumPy Zipf 分布

文件输入 &输出

NumPy 使用 NumPy 进行 I/O NumPy 从文件读取数据 NumPy 将数据写入文件 NumPy 支持的文件格式

数学函数

NumPy 数学函数 NumPy 三角函数 NumPy 指数函数 NumPy 对数函数 NumPy 双曲函数 NumPy 舍入函数

傅里叶变换

NumPy 离散傅里叶变换 (DFT) NumPy 快速傅里叶变换 (FFT) NumPy 逆傅里叶变换 NumPy 傅里叶级数和变换 NumPy 信号处理应用 NumPy 卷积

多项式

NumPy 多项式表示 NumPy 多项式运算 NumPy 求多项式的根 NumPy 求多项式的根

统计

NumPy 统计函数 NumPy 描述性统计

日期时间函数

NumPy 日期和时间基础知识 NumPy 表示日期和时间 NumPy 日期和时间运算 NumPy 使用日期时间进行索引 NumPy 时区处理 NumPy 时间序列分析 NumPy 处理时间增量 NumPy 闰秒处理 NumPy 矢量化日期时间运算

ufunc

NumPy ufunc 简介 NumPy 创建通用函数 (ufunc) NumPy 算术通用函数 (ufunc) NumPy 小数舍入 ufunc NumPy 对数通用函数(ufunc) NumPy 求和通用函数 (ufunc) NumPy 乘积通用函数 (ufunc) NumPy 差分通用函数 (ufunc) NumPy 寻找最小公倍数 (LCM) NumPy 寻找最大公约数 (GCD) NumPy 三角函数 (ufunc) NumPy 双曲线 (ufunc) NumPy 集合运算(ufunc)

实用资源

NumPy 快速指南 NumPy 备忘单


NumPy - 时间序列分析

NumPy 中的时间序列分析

时间序列分析是一种用于分析按时间顺序排列的数据点的技术,例如股票价格、销售数据或温度读数。NumPy 及其数组操作允许您处理、操作和分析时间序列数据。

在本教程中,我们将探索如何使用 NumPy 进行时间序列分析,涵盖创建时间序列数组、执行统计操作以及可视化随时间变化的趋势等重要技术。

使用 NumPy 创建时间序列数据

在 NumPy 中创建时间序列通常涉及生成一个与一系列时间点对应的 datetime 对象数组。您可以使用 NumPy 的 datetime64 数据类型创建基于时间的数组。

有了时间序列后,您就可以将相关数据(例如股票价格或温度)与时间点一起存储。

示例

在以下示例中,我们将创建一个表示每日时间戳的简单时间序列数组,以及一个表示股票价格的关联数据数组 -

import numpy as np

# 为每日数据创建时间序列数组
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04', '2024-01-05'], dtype='datetime64[D]')

# 创建一个与日期对应的股票价格数组
stock_prices = np.array([150.25, 152.75, 153.50, 155.00, 154.25])

print("日期:", dates)
print("股价:", stock_prices)

输出将显示相应的时间序列数据 -

日期:['2024-01-01' '2024-01-02' '2024-01-03' '2024-01-04' '2024-01-05']
股价:[150.25 152.75 153.5 155. 154.25]

时间序列数据的统计分析

NumPy 提供了几个可用于时间序列分析的统计函数。例如,您可以计算一段时间内的平均值、标准差和累计和,以观察数据的趋势和波动。

示例

在以下示例中,我们将计算时间序列中的平均股价和股价的累计和 -

import numpy as np

# 股价时间序列
stock_prices = np.array([150.25, 152.75, 153.50, 155.00, 154.25])

# 计算平均股价
mean_price = np.mean(stock_prices)

# 计算股价的累计和
cumulative_sum = np.cumsum(stock_prices)

print("平均股价:", mean_price)
print("累计股票价格总和:",cumulative_sum)

输出结果如下 −

平均股价:153.15
股票价格累计总和:[150.25 303.   456.5  611.5  765.75]

计算随时间变化的差异和变化

在时间序列分析中,计算连续数据点之间的差异通常有助于理解随时间的变化。

NumPy 的 diff() 函数允许您计算数组中每对相邻值之间的差异,这对于识别趋势、波动性或增长率非常有用。

示例

在此示例中,我们将使用 NumPy 的diff() 函数 −

import numpy as np

# 股票价格的时间序列
stock_prices = np.array([150.25, 152.75, 153.50, 155.00, 154.25])

# 计算股票价格的每日变化
price_changes = np.diff(stock_prices)

print("价格变化:", price_changes)

输出将显示股票价格的每日变化 -

价格变化:[ 2.5   0.75  1.5  -0.75]

可视化时间序列数据

可视化时间序列数据有助于识别随时间变化的趋势、模式和异常。虽然 NumPy 没有内置绘图函数,但您可以轻松使用外部库(例如 Matplotlib)来可视化时间序列数据以及 NumPy 数组。

示例

在以下示例中,我们将使用 Matplotlib 绘制股票价格的时间序列 -

import numpy as np
import matplotlib.pyplot as plt

# 日期和股票价格的时间序列
dates = np.array(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04', '2024-01-05'], dtype='datetime64[D]')
stock_prices = np.array([150.25, 152.75, 153.50, 155.00, 154.25])

# 绘制股价随时间变化的曲线
plt.plot(dates, stock_prices)
plt.xlabel('日期')
plt.ylabel('股价')
plt.title('股价时间序列')
plt.xticks(rotation=45)
plt.show()

这将生成一个简单的折线图,显示股价随时间变化的趋势 -

时间序列分析

重采样时间序列数据

重采样是时间序列分析中的一项重要技术,它涉及改变数据的频率。根据分析的性质,您可能需要将数据从每日重采样为每月,或从每小时重采样为每日。

虽然 NumPy 不直接提供重采样函数,但您可以使用 NumPy 的切片和聚合方法来实现这一点。

示例

在此示例中,我们将通过取每周的平均值将每日股价重采样为每周平均值 -

import numpy as np

# 10 天的每日股价
daily_prices = np.array([150.25, 152.75, 153.50, 155.00, 154.25, 156.00, 158.00, 160.25, 162.50, 163.75])

# 重新采样为每周平均值(为简单起见,假设每周 7 天)
weekly_avg = np.mean(daily_prices[:7].reshape(-1, 7), axis=1)

print("每周平均股价:", weekly_avg)

输出将显示每周平均价格 −

每周平均股价:[154.25]