如何使用 Pandas 读取 csv 文件时跳过行

pandaspythonserver side programmingprogramming

Python 有一个内置方法 read_csv,可用于在使用 Pandas 读取 csv 文件时设置跳过行。CSV 代表逗号分隔值,是包含数据库的文件的扩展名。此技术可用于任何涉及从 CSV 文件读取和处理数据的应用程序。各种应用程序都使用数据过滤、excel 工具等。

语法

示例中使用了以下语法 -

read_csv('file_name.csv', skiprows= 根据用户选择设置条件)

这是 pandas 模块的内置函数,可以读取 CSV 文件的数据。它接受两个参数 -

  • filename.csv - csv 是文件扩展名的简单表示。

  • skiprows - 此参数允许用户根据跳过/删除行设置条件。

示例 1

在下面的示例中,我们将通过导入名为 pandas 的模块并将引用对象作为 pd 来启动程序。然后初始化名为 df 的变量,该变量通过内置方法 read_csv() 存储值,该方法接受两个参数 - demo.csv(文件的名称)和 skiprows(设置特定索引行)。skiprows 使用列表推导来设置行。最后,我们只使用变量 df 以表格形式获取数据。

#跳过多行
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=[1,5,12])
df

输出

示例 2

在下面的示例中,我们将展示如何从数据中跳过一行。首先,导入 pandas 模块,该模块有助于设置读取数据的操作。将 pd 作为将用于分配 read_csv 的对象引用。通过使用此内置函数,它接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置为值 1,从表中删除第一行)。

#skip only single rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=1)
df

输出

示例 3

在下面的示例中,我们将首先导入可用于处理其名为 pd 的对象引用的 pandas 模块。接下来,我们将使用 pd 将值存储为内置方法 read_csv,该方法接受两个参数 - 'demo.csv'(文件名)和 skiprows(设置偶数条件的值)。最后,使用变量 df 获取输出。

# 根据偶数条件跳过行
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0)
# 按偶数顺序打印月份
df

输出

示例 4

在下面的示例中,通过导入名为 pandas 的模块来开始程序。然后使用内置方法 read_csv 设置两个参数 - 'demo.csv'(文件名)和 skiprows(将值设置为 lamda x:x>5,仅设置前五行)。接下来使用变量df获取5行数据。

# 根据某些行跳过行
import pandas as pd
df = pd.read_csv('demo.csv', skiprows= lambda x:x>5)
df

输出

示例5

在下面的示例中,程序从pandas模块开始,并将对象引用设置为pd。然后使用内置方法初始化存储值的名为 df 的变量,它接受三个参数 - 'demo.csv'(文件的名称)、skiprows(在列表中设置值整数 2 和 10 以从表中删除数据)和 nrows(将值设置为 10,这意味着只有 10 行可用)。

import pandas as pd
df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10)
df

输出

结论

我们通过对 skiprows 概念应用各种条件进行了讨论。我们使用 skiprows 条件跳过单行、跳过多行、基于偶数条件跳过行、基于特定条件跳过行以及跳过 CSV 文件中的特定行。


相关文章