数据科学 - Python 数据框
使用 Pandas 创建数据框
DataFrame 数据框是数据的结构化表示。
让我们用虚构的数字定义一个 3 列 5 行的数据框:
实例
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
亲自试一试 »
实例解析
- 将 Pandas 库导入为 pd
- 用名为 d 的变量中的列和行定义数据
- 使用函数 pd.DataFrame() 创建数据框
- 数据框包含 3 列 5 行
- 使用 print() 函数打印数据帧输出
我们在 DataFrame() 前面写 pd. 让 Python 知道我们要激活 Pandas 库中的 DataFrame() 函数。
注意DataFrame中的大写D和F!
解释输出
这是输出:
我们看到"col1"、"col2"和"col3"是列的名称。
不要对从 0 到 4 的垂直数字感到困惑。 它们告诉我们有关行位置的信息。
在 Python 中,行的编号从零开始。
现在,我们可以使用 Python 来计算列数和行数了。
我们可以使用 df.shape[1] 来查找列数:
我们可以使用 df.shape[0] 来查找行数:
为什么我们不能自己数行数和列数?
如果我们使用包含许多列和行的较大数据集,您自己计算它会令人困惑。 您可能会错误地计算它。 如果我们正确使用 Python 中的内置函数,就可以确保计数是正确的。