数据科学- 什么是数据?
什么是数据?
数据是信息的集合。
数据科学的一个目的是结构化数据,使其可解释且易于使用。
数据可以分为两组:
- 结构化数据
- 非结构化数据
非结构化数据
非结构化数据没有组织。 我们必须组织数据以进行分析。
结构化数据
结构化数据井井有条,更易于使用。
如何构建数据?
我们可以使用数组或数据库表来构造或呈现数据。
数组示例:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
以下示例展示了如何在 Python 中创建数组:
在数据科学中处理非常大的数据集是很常见的。
在本教程中,我们将尝试尽可能简单地理解数据科学的概念。 因此,我们将使用易于解释的小型数据集。