数据科学- 数据库表

数据库表

数据库表是具有结构化数据的表。

下表显示了一个数据库表,其中包含从运动手表中提取的健康数据:

Duration Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

此数据集包含典型训练课程的信息,例如持续时间、平均脉搏、卡路里消耗等。


数据库表结构

一个数据库表由列和行组成:

Column 1 Column 2 Column 3 Column 4 Column 5 Column 6
Duration Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
Row 1 30 80 120 240 10 7
Row 2 30 85 120 250 10 7
Row 3 45 90 130 260 8 7
Row 4 45 95 130 270 8 7
Row 5 45 100 140 280 0 7
Row 6 60 105 140 290 7 8
Row 7 60 110 145 300 7 8
Row 8 60 115 145 310 8 8
Row 9 75 120 150 320 0 8
Row 10 75 125 150 330 8 8

行是数据的水平表示。

列是数据的垂直表示。



变量

变量被定义为可以测量或计数的东西。

示例可以是字符、数字或时间。

在下面的例子中,我们可以观察到每一列代表一个变量。

Duration Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

共有 6 列,表示有 6 个变量(Duration、Average_Pulse、Max_Pulse、Calorie_Burnage、Hours_Work、Hours_Sleep)。

有 11 行,表示每个变量有 10 个观察值。

但是如果有 11 行,为什么只有 10 个观察值?

因为第一行是标签,也就是说是变量的名称