获取 Pandas DataFrame 的最后 n 条记录

pythonpandasserver side programmingprogramming

数据分析经常面临处理大量数据集的问题,这通常需要修改数据才能产生有价值的见解。在某些情况下,从 Pandas DataFrame 中提取最近的 n 个条目的能力可能会有所帮助。本文的目标是提供成功完成此活动的详尽操作手册。

安装和语法

pip install pandas

安装 Pandas 后,您可以使用 CSV 文件或数据库查询的结果从各种数据源创建 DataFrame。

import pandas as pd
data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'],
        'Age': [23, 34, 45, 19, 28, 31],
        'Gender': ['M', 'M', 'F', 'F', 'F', 'M']}
df = pd.DataFrame(data)

算法

Pandas DataFrame 的 tail() 函数检索 DataFrame 的最后 n 行,可用于获取 DataFrame 的最后 n 个条目。以下阶段构成了用于完成此任务的算法:

  • shape 参数可用于确定 DataFrame 中有多少行。

  • 要获取 DataFrame 的最后 n 行,请使用 tail() 函数。

  • 您可以选择将生成的 DataFrame 的索引设置为 0。

示例

现在让我们看一个示例,该示例演示如何检索 DataFrame 的最后 3 条记录。我们将使用上一节中创建的 DataFrame。

import pandas as pd

data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'],
        'Age': [23, 34, 45, 19, 28, 31],
        'Gender': ['M', 'M', 'F', 'F', 'F', 'M']}

df = pd.DataFrame(data)

last_3_records = df.tail(3)
print(last_3_records)

输出

    Name  Age Gender
3  Julie   19      F
4   Lisa   28      F
5  David   31      M

生成的 last_3_records DataFrame 将包含 df DataFrame 的最后三行。我们可以使用 reset_index() 函数将生成的 DataFrame 的索引重置为从 0 开始。

last_3_records = last_3_records.reset_index(drop=True)

生成的 last_3_records DataFrame 将具有从 0 开始的索引。

    Name  Age Gender
0  Julie   19      F
1   Lisa   28      F
2  David   31      M

应用

检索 Pandas DataFrame 的最后 n 条记录在各种情况下都很有用,例如:

  • 分析大型数据集中的最新数据条目。

  • 测试和验证将数据插入 DataFrame。

  • 使用最近的数据条目构建机器学习模型。

结论

总之,检索 Pandas DataFrame 的最后 n 条记录是一项简单而有效的任务,可以使用 tail() 函数完成。我们可以选择将生成的 DataFrame 的索引重置为从 0 开始。此技术在各种情况下都很有用,例如分析最近的数据条目或验证将数据插入 DataFrame。


相关文章