AWS Athena - 入门
设置您的 AWS Athena 环境
设置您的 AWS Athena 环境非常简单,而且对于高效地对存储在 Amazon S3 中的数据运行 SQL 查询非常重要。
先决条件
以下是开始使用 AWS Athena 前的先决条件 −
- 您必须拥有 AWS 账户 才能使用 AWS Athena。
- 您应该拥有 IAM 角色,它允许 AWS Athena 从 Amazon S3 访问您的数据。
- 您应该将 数据存储在 Amazon S3 中。
满足这些先决条件后,请按照以下步骤设置您的 AWS Athena 环境−
步骤 1:登录 AWS 控制台
首先,您需要登录 AWS 管理控制台。然后导航到 Amazon Athena 服务。您也可以在搜索栏中搜索 Athena。
步骤 2:创建 S3 存储桶
在运行查询之前,必须将数据存储在 Amazon S3 中。这是因为 AWS Athena 直接从 S3 查询数据。
如果您尚未创建存储桶,请先转到 S3 服务并单击"创建存储桶"按钮来创建它。
步骤 3:配置 AWS Glue 数据目录
AWS Athena 需要数据目录来定义数据集的结构。为此,建议配置 AWS Glue 数据目录。
AWS Glue 可以自动与 Athena 集成,并帮助您将数据组织到表中。在 AWS Glue 中,您需要创建一个爬虫,该爬虫会扫描您的 S3 数据并在 Athena 数据目录中创建表架构。
步骤 4:设置 IAM 权限
Aws Athena 需要权限才能访问 S3 和其他 AWS 服务。您需要创建或分配一个具有必要权限的 IAM 角色,以便 Athena 访问您的 S3 存储桶和 Glue 数据目录。
在 AWS Athena 中创建您的第一个查询
现在,当您设置 AWS Athena 环境时,您就可以在 Athena 中创建您的第一个查询了。在 AWS Athena 中创建查询是一个非常简单的过程。它允许您轻松分析数据。
按照以下步骤在 Athena − 中创建您的第一个查询
步骤 1:打开 Athena 控制台
首先,登录您的 AWS 管理控制台并导航到 Athena 服务。
步骤 2:选择您的数据库
接下来,打开 Athena 查询编辑器。现在选择存储数据的数据库。此数据库应包含您的表。
查看下图,其中我们选择了名为 "tutorialpoint" 的数据库 −

步骤 3:编写 SQL 查询
现在,您可以开始编写 SQL 查询。使用您在所选数据库中创建并保存的表。
步骤 4:运行查询
编写查询后,要运行它,请单击"运行查询"按钮。AWS Athena 将执行您的 SQL 语句并从指定的表中检索数据。
步骤 5:查看结果
查询完成执行后,它将在查询编辑器下方显示结果。您还可以以 CSV 等各种格式下载结果。
第 6 步:保存您的查询
您还可以保存您的查询并在将来再次使用该查询。
按照上述步骤,您可以轻松地在 AWS Athena 中创建和运行您的第一个查询。