从列表创建 Pandas DataFrame
Pandas DataFrame 是一个二维表,其行和列是不可变的,这意味着一旦创建它们就无法更改。使用列表从头创建 DataFrame 是数据科学和信息技术中的一项常见任务。列表是元素的有序集合,它是 Python 中最常用的数据结构之一。列表可以存储任何类型的值,例如数字、字符串和布尔值。
在本文档中,我将使用分步说明、代码片段和每个小节的解释,详细说明如何通过实际示例从列表创建 Pandas DataFrame。
数据框和列表之间的主要区别是什么?
列表是 Python 中的基本数据结构,可以保存任何数据类型的元素集合,而数据框是二维表状结构,类似于电子表格或 SQL 表,将数据存储在行和列中。以下是数据框和列表之间的一些主要区别 -
结构 - 列表是一个简单的一维值集合,而数据框是具有行和列的二维表状结构。
数据类型 - 列表可以保存任何数据类型的元素,包括数字、字符串甚至其他列表,而数据框旨在以表格格式保存数据,列具有特定数据类型,例如整数、浮点数和字符串。
大小 - 列表可以保存任意数量的元素,而数据框通常设计为保存大量数据,可能有数百万行和列。
操作 - 列表支持基本操作,例如索引、切片和附加,而数据框支持更复杂的操作,例如过滤、连接和分组。
数据操作 − 列表提供数据操作的基本功能,而数据框提供强大的数据操作工具,例如根据特定标准过滤、排序和聚合数据。
先决条件
在深入研究任务之前,应该在您的系统上安装一些东西 −
推荐设置列表 −
pip install pandas, bokeh
预计用户可以访问任何独立 IDE,例如 VS-Code、PyCharm、Atom 或 Sublime text。
甚至可以使用在线 Python 编译器,例如 Kaggle.com、Google Cloud 平台或任何其他编译器。
已更新Python 版本。在撰写本文时,我使用的是 3.10.9 版本。
了解 Jupyter 笔记本的使用。
虚拟环境的知识和应用将是有益的,但不是必需的。
还希望此人对统计学和数学有很好的理解。
所需步骤
导入库
要在 Pandas 中创建 DataFrame,我们需要导入 Pandas 库。以下代码用于导入 Pandas 库 −
import pandas as pd
创建列表
在使用列表创建 DataFrame 之前,我们首先需要创建列表来存储数据。在本节中,我将向您展示如何使用简单数据通过真实示例创建列表。
创建姓名列表
names = ['John', 'Mary', 'Peter', 'Jane', 'Daniel']
在上面的代码片段中,我们创建了一个名为"names"的列表,其中包含五个代表个人姓名的字符串值。
创建年龄列表
ages = [32, 25, 41, 29, 36]
在上面的代码片段中,我们创建了一个名为"ages"的列表,其中包含五个代表个人年龄的整数值。
创建布尔值列表值
current_status = [True, False, True, False, True]
在上面的代码片段中,我们创建了一个名为 `current_status` 的列表,其中包含五个布尔值,代表个人的当前状态。
从列表创建 DataFrame
一旦我们有了包含数据的列表,我们就可以使用 `pd.DataFrame()` 函数在 Pandas 中创建 DataFrame。我们可以将列表作为参数传递给 `pd.DataFrame()` 函数。以下代码用于从列表创建 DataFrame −
df = pd.DataFrame(list(zip(names, ages, current_status)), columns=['Name', 'Age', 'Current_Status'])
在上面的代码片段中,我们首先使用 `zip()` 函数创建了一个元组列表。`zip()` 函数将列表组合成一个元组列表。然后,我们将这个元组列表作为第一个参数传递给 `pd.DataFrame()` 函数。
`pd.DataFrame()` 函数的第二个参数是 DataFrame 的列名列表。在本例中,我们使用 `columns=['Name', 'Age', 'Current_Status']` 将列名指定为 `Name`、`Age` 和 `Current_Status`。
查看 DataFrame
创建 DataFrame 后,我们可以使用 `.head()` 函数查看 DataFrame 的前几行。以下代码用于显示 DataFrame 的前几行 −
print(df.head())
在上面的代码片段中,我们使用 `.head()` 函数显示 DataFrame 的前几行。
输出
Name Age Current_Status 0 John 32 True 1 Mary 25 False 2 Peter 41 True 3 Jane 29 False 4 Daniel 36 True
在上面的输出中,我们可以从列表中创建一个数据框。
结论
在本文档中,我提供了有关如何从列表创建 Pandas DataFrame 的分步指南。我演示了如何导入 Pandas 库、创建列表以及如何使用 `pd.DataFrame()` 函数创建 DataFrame。此外,我还展示了如何使用 `.head()` 函数查看 DataFrame 的前几行。按照这些说明,您现在应该能够使用真实示例从列表创建 Pandas DataFrame。