AWS Quicksight - 使用数据源
AWS Quicksight 接受来自各种来源的数据。单击主页上的"新数据集"后,它会为您提供所有可用数据源的选项。
以下是包含所有内部和外部源列表的源 −

让我们了解如何将 Quicksight 与一些最常用的数据源连接 −
从系统上传文件
它仅允许您输入 .csv、.tsv、.clf、.elf.xlsx 和 Json 格式的文件。选择文件后,Quicksight 会自动识别文件并显示数据。单击上传文件按钮时,您需要提供要用于创建数据集的文件的位置。
使用 S3 格式的文件
屏幕将显示如下。在数据源名称下,您可以输入要显示的要创建的数据集的名称。此外,您还需要从本地系统上传清单文件或提供清单文件的 S3 位置。

清单文件是 json 格式的文件,它指定输入文件的 url/位置及其格式。您可以输入多个输入文件,只要格式相同。以下是清单文件的示例。用于传递输入文件位置的"URI"参数是 S3。
{ "fileLocations": [ { "URIs": [ "url of first file", "url of second file", "url of 3rd file and so on" ] }, ], } "globalUploadSettings": { "format": "CSV", "delimiter": ",", "textqualifier": "'", "containsHeader": "true" }
globalUploadSettings 中传递的参数是默认参数。您可以根据需要更改这些参数。
MySQL
您需要在字段中输入数据库信息才能连接到您的数据库。一旦连接到您的数据库,您就可以从中导入数据。

连接到任何 RDBMS 数据库时都需要以下信息 −
- DSN 名称
- 连接类型
- 数据库服务器名称
- 端口
- 数据库名称
- 用户名
- 密码
Quicksight 支持以下基于 RDBMS 的数据源 −
- Amazon Athena
- Amazon Aurora
- Amazon Redshift
- Amazon Redshift Spectrum
- Amazon S3
- Amazon S3 Analytics
- Apache Spark 2.0 或更高版本
- MariaDB 10.0 或更高版本
- Microsoft SQL Server 2012 或更高版本
- MySQL 5.1 或更高版本
- PostgreSQL 9.3.1 或更高版本
- Presto 0.167 或更高版本
- Snowflake
- Teradata 14.0 或更高版本
Athena
Athena 是用于在表上运行查询的 AWS 工具。您可以从 Athena 中选择任何表,也可以 在这些表上运行自定义查询,并在 Quicksight 中使用这些查询的输出。选择数据源有几个步骤
当您选择 Athena 时,会出现以下屏幕。您可以输入任何想要在 Quicksight 中提供给数据源的数据源名称。单击"验证连接"。验证连接后,单击"创建新源"按钮

现在从下拉列表中选择表名称。下拉列表将显示 Athena 中存在的数据库,并将进一步显示该数据库中的表。否则,您可以单击"使用自定义 SQL"在 Athena 表上运行查询。

完成后,您可以单击"编辑/预览数据"或"可视化"来编辑数据或根据您的要求直接可视化数据。

删除数据源
当您删除任何 Quicksight 仪表板中正在使用的数据源时,可能会使相关数据集无法使用。这通常发生在您查询基于 SQL 的数据源时。
当您基于 S3、Sales force 或 SPICE 创建数据集时,它不会影响您使用任何数据集的能力,因为数据存储在 SPICE 中;但是在这种情况下刷新选项不可用。
要删除数据源,请选择数据源。在创建数据集页面上导航到"来自现有数据源"选项卡。

在删除之前,您还可以确认估计的表大小和数据源的其他详细信息。
