获取 Pandas DataFrame 的最后 n 条记录
数据分析经常面临处理大量数据集的问题,这通常需要修改数据才能产生有价值的见解。在某些情况下,从 Pandas DataFrame 中提取最近的 n 个条目的能力可能会有所帮助。本文的目标是提供成功完成此活动的详尽操作手册。
安装和语法
pip install pandas
安装 Pandas 后,您可以使用 CSV 文件或数据库查询的结果从各种数据源创建 DataFrame。
import pandas as pd data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'], 'Age': [23, 34, 45, 19, 28, 31], 'Gender': ['M', 'M', 'F', 'F', 'F', 'M']} df = pd.DataFrame(data)
算法
Pandas DataFrame 的 tail() 函数检索 DataFrame 的最后 n 行,可用于获取 DataFrame 的最后 n 个条目。以下阶段构成了用于完成此任务的算法:
shape 参数可用于确定 DataFrame 中有多少行。
要获取 DataFrame 的最后 n 行,请使用 tail() 函数。
您可以选择将生成的 DataFrame 的索引设置为 0。
示例
现在让我们看一个示例,该示例演示如何检索 DataFrame 的最后 3 条记录。我们将使用上一节中创建的 DataFrame。
import pandas as pd data = {'Name': ['John', 'Mark', 'Alice', 'Julie', 'Lisa', 'David'], 'Age': [23, 34, 45, 19, 28, 31], 'Gender': ['M', 'M', 'F', 'F', 'F', 'M']} df = pd.DataFrame(data) last_3_records = df.tail(3) print(last_3_records)
输出
Name Age Gender 3 Julie 19 F 4 Lisa 28 F 5 David 31 M
生成的 last_3_records DataFrame 将包含 df DataFrame 的最后三行。我们可以使用 reset_index() 函数将生成的 DataFrame 的索引重置为从 0 开始。
last_3_records = last_3_records.reset_index(drop=True)
生成的 last_3_records DataFrame 将具有从 0 开始的索引。
Name Age Gender 0 Julie 19 F 1 Lisa 28 F 2 David 31 M
应用
检索 Pandas DataFrame 的最后 n 条记录在各种情况下都很有用,例如:
分析大型数据集中的最新数据条目。
测试和验证将数据插入 DataFrame。
使用最近的数据条目构建机器学习模型。
结论
总之,检索 Pandas DataFrame 的最后 n 条记录是一项简单而有效的任务,可以使用 tail() 函数完成。我们可以选择将生成的 DataFrame 的索引重置为从 0 开始。此技术在各种情况下都很有用,例如分析最近的数据条目或验证将数据插入 DataFrame。