将数据附加到空的 Pandas DataFrame
简介
数据结构(称为数据框)是二维标记数组,其列可能属于各种数据类型。您可以将其与电子表格、SQL 表甚至 Series 对象的字典进行比较,以便更好地理解它。大多数时候使用的都是 panda 项目。
除了数据本身之外,您还可以选择传递索引(行标签)和列(列标签)的参数。如果您提供索引和/或列,则可以确保这些元素将出现在调用后生成的 DataFrame 中。因此,如果您将 Series 字典与某个索引组合,它将丢弃与所提供索引不匹配的所有数据。
在本文中,我们将学习如何将数据附加到空的 Pandas Dataframe。
Pandas
Pandas 是一个免费的开源库,主要是为了以直接直观的方式处理关系数据或标记数据而开发的。其主要目标是使此类任务更容易完成。它提供了广泛的数据结构和操作,所有这些都可以用于处理数值数据和时间序列。这个库的创建基于 NumPy 库,它是基础。Pandas 非常快,它为用户提供了出色的速度和生产力。
Wes McKinney 早在 2008 年就提出了 Pandas 的想法,当时他还在 AQR Capital Management 工作。他成功说服 AQR 允许他开源 Pandas。2012 年,AQR 的另一名员工 Chang She 成为该库的第二大贡献者。Pandas 在整个过程中以各种迭代发布。Pandas 现在运行的是 1.5.2 版本,该版本于 2022 年 11 月 22 日可供下载。
数据框
称为数据框的数据结构是一个二维标记数组,其列可能属于各种数据类型。您可以将其与电子表格、SQL 表甚至 Series 对象的字典进行比较,以更好地理解它。它是绝大多数时间使用的熊猫项目。Pandas DataFrame 是一种二维的表格数据结构,其大小可以更改,它可以包含可能不同类型的数据,并且它具有命名轴(行和列)。数据框是一种二维数据结构,这意味着数据以行和列的表格形式组织。数据、行和列是构成 Pandas DataFrame 的三个主要组件。
除了数据本身(列标签)之外,您还可以选择提供索引参数(行标签)以及列参数。当您调用方法并提供索引和/或列时,您可以确保这些组件将包含在执行该方法后生成的 DataFrame 中。因此,如果将 Series 字典与某个索引组合,它将丢弃与给定索引不对应的任何数据,只保留匹配的数据。
如何创建空的 Dataframe?
通过从 Python 库中获取 pandas,您可以创建一个空的数据框。稍后,使用 pd.DataFrame() 创建一个没有行或列的数据框,如下例所示。请注意,pandas 库的 DataFrame() 类类似于构造函数,用于构建类。
代码示例
import pandas as pdd dtf = pdd.DataFrame() #使用 pandas 创建空数据框 print(dtf)
输出
空数据框 列:[] 索引:[]
如何将数据附加到空数据框?
将行附加到空数据框
import pandas as pdd dtf_p = pdd.DataFrame() #使用 pandas 创建一个空数据框 print(dtf_p) d3 = pd.DataFrame( [["ID","Name","GPA","Course","Country"], [128, "Siri",1.8,"BA","US" ], [18, "Georgia",2,"MTech", "UK"]], ) dtf_p=dtf_p.append(d3,ignore_index=False) dtf_p
输出
将一列附加到空数据框
import pandas as pdd dtf_p = pdd.DataFrame() #an empty data frame is created using pandas print(dtf_p) add = ['Delhi', 'Bangalore', 'Chennai', 'Patna'] name=['Shruti','Amiolika','Saba','Parul'] dtf_p['Name'] = name dtf_p['Address'] = add print(dtf_p)
输出
Empty DataFrame Columns: [] Index: [] Name Address 0 Shruti Delhi 1 Amiolika Bangalore 2 Saba Chennai 3 Parul Patna
结论
在本文中,我们了解了什么是 pandas 库、什么是数据框、如何实现空数据框以及如何将行和列附加到数据框。