数据科学- 什么是数据?

什么是数据?

数据是信息的集合。

数据科学的一个目的是结构化数据,使其可解释且易于使用。

数据可以分为两组:

  • 结构化数据
  • 非结构化数据

非结构化数据

非结构化数据没有组织。 我们必须组织数据以进行分析。

Unstructured Data

Unstructured Data


结构化数据

结构化数据井井有条,更易于使用。

Structured Data


如何构建数据?

我们可以使用数组或数据库表来构造或呈现数据。

数组示例:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

以下示例展示了如何在 Python 中创建数组:

实例

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
亲自试一试 »

在数据科学中处理非常大的数据集是很常见的。

在本教程中,我们将尝试尽可能简单地理解数据科学的概念。 因此,我们将使用易于解释的小型数据集。