DynamoDB - 数据管道

数据管道允许向表、文件或 S3 存储桶导出和导入数据。 当然,这在备份、测试以及类似的需求或场景中证明是有用的。

在导出中,您可以使用 Data Pipeline 控制台,该控制台会创建一个新管道并启动 Amazon EMR (Elastic MapReduce) 集群来执行导出。 EMR 从 DynamoDB 读取数据并写入目标。 我们将在本教程后面详细讨论 EMR。

在导入操作中,您可以使用 Data Pipeline 控制台,该控制台会创建管道并启动 EMR 来执行导入。 它从源读取数据并将数据写入目标。

注意 − 考虑到所使用的服务,特别是 EMR 和 S3,导出/导入操作会产生成本。

使用数据管道

使用 Data Pipeline 时,您必须指定操作和资源权限。 您可以利用 IAM 角色或策略来定义它们。 执行导入/导出的用户应注意,他们需要有效的访问密钥 ID 和秘密密钥。

数据管道的 IAM 角色

您需要两个 IAM 角色才能使用 Data Pipeline −

  • DataPipelineDefaultRole − 这包含您允许管道为您执行的所有操作。

  • DataPipelineDefaultResourceRole − 其中包含您允许管道为您配置的资源。

如果您是数据管道新手,则必须生成每个角色。 由于现有角色,所有以前的用户都拥有这些角色。

使用 IAM 控制台为 Data Pipeline 创建 IAM 角色,并执行以下四个步骤 −

步骤 1 − 登录位于 https://console.aws.amazon.com/iam/ 的 IAM 控制台

步骤 2 − 从仪表板中选择角色

步骤 3 − 选择创建新角色。 然后在角色名称字段中输入DataPipelineDefaultRole,并选择下一步。 在角色类型面板的AWS服务角色列表中,导航到数据管道,然后选择选择。 在审核面板中选择创建角色

步骤 4 − 选择创建新角色