AWS Athena - 编写 SQL 查询

如何在 Athena 中创建表?

在 AWS Athena 中运行任何查询之前,您需要创建一个引用 Amazon S3 中数据的表。Athena 使用读取时模式方法,这意味着您在查询数据时定义数据的结构,而不是在存储数据时定义数据的结构。

让我们了解在 Athena 中创建表的步骤 −

登录 AWS Athena 控制台

首先,从 AWS 管理控制台访问 Athena。

定义表模式

编写定义表结构的 SQL 查询。例如 −

CREATE EXTERNAL TABLE IF NOT EXISTS your_table_name (
   column1 STRING,
   column2 INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION 's3://your-bucket/folder/';

执行查询

现在,在 Athena 查询编辑器中运行此查询以创建表。这将允许您引用指定 S3 存储桶中的数据。

在 Athena 中运行基本 SQL 查询

创建表后,您可以开始运行 SQL 查询来分析数据。Athena 支持标准 SQL,这使得熟悉 SQL 的用户可以轻松编写查询。下面给出了一个简单查询的示例

SELECT * FROM your_table_name LIMIT 10;

此查询将从指定的表中获取前 10 行。您还可以过滤数据、连接多个表并使用聚合函数,就像在任何基于 SQL 的数据库中一样。

示例

让我们借助示例来理解它。在这里,我们创建了一个数据库、一个表,然后在 Athena 查询编辑器中对该表运行查询 −

Athena 查询编辑器