Amazon Web Services - Redshift

Amazon Redshift 是一种完全托管的云数据仓库服务。其数据集从数百 GB 到 1 PB 不等。创建数据仓库的初始过程是启动一组称为 节点 的计算资源,这些资源被组织成称为 集群 的组。之后,您可以处理查询。

如何设置 Amazon Redshift?

以下是设置 Amazon Redshift 的步骤。

步骤 1 − 使用以下步骤登录并启动 Redshift 集群。

  • 登录 AWS 管理控制台并使用以下链接打开 Amazon Redshift 控制台 − https://console.aws.amazon.com/redshift/

  • 使用屏幕右上角的区域菜单选择要创建集群的区域。

  • 单击启动集群按钮。

启动集群
  • 将打开"集群详细信息"页面。提供所需的详细信息,然后单击"继续"按钮,直到进入审核页面。

集群详细信息
  • 将打开一个确认页面。单击"关闭"按钮完成,以便集群在集群列表中可见。

集群关闭
  • 在列表中选择集群并查看集群状态信息。该页面将显示集群状态。

集群状态

第 2 步 −配置安全组以授权客户端连接到集群。授权访问 Redshift 取决于客户端是否授权 EC2 实例。

按照以下步骤在 EC2-VPC 平台上配置安全组。

  • 打开 Amazon Redshift 控制台并单击导航窗格上的集群。

  • 选择所需的集群。其配置选项卡打开。

Snowplow
  • 单击安全组。

  • 打开安全组页面后,单击入站选项卡。

安全组
  • 单击编辑按钮。设置如下所示的字段,然后单击保存按钮。

    • 类型 − 自定义 TCP 规则。

    • 协议 − TCP。

    • 端口范围 −输入启动集群时使用的相同端口号。Amazon Redshift 的默认端口为 5439。

    • 来源 − 选择自定义 IP,然后输入 0.0.0.0/0。

编辑入站规则

步骤 3 − 连接到 Redshift 集群。

有两种方法可以连接到 Redshift 集群 − 直接或通过 SSL。

以下是直接连接的步骤。

Cluster
  • 使用以下步骤将 Cluster 与 SQL Workbench/J 连接。

    • 打开 SQL Workbench/J。

    • 选择文件并单击连接窗口。

    • 选择创建新的连接配置文件并填写所需的详细信息,如名称等。

    • 单击管理驱动程序,管理驱动程序对话框将打开。

    • 单击创建新条目按钮并填写所需的详细信息。

管理驱动程序
  • 单击文件夹图标并导航到驱动程序位置。最后,单击"打开"按钮。

Redshift
  • 将"类名"框和"示例 URL"框留空。单击"确定"。

  • 从列表中选择驱动程序。

  • 在 URL 字段中,粘贴复制的 JDBC URL。

  • 在相应的字段中输入用户名和密码。

  • 选择"自动提交"框并单击"保存配置文件列表"。

选择连接配置文件

Amazon Redshift 的功能

以下是 Amazon Redshift 的功能 −

  • 支持 VPC −用户可以在 VPC 内启动 Redshift,并通过虚拟网络环境控制对集群的访问。

  • 加密 − 在 Redshift 中创建表时,可以加密和配置存储在 Redshift 中的数据。

  • SSL − SSL 加密用于加密客户端和 Redshift 之间的连接。

  • 可扩展 − 只需单击几下,即可根据需要轻松扩展 Redshift 数据仓库中的节点数量。它还允许扩展存储容量而不会造成任何性能损失。

  • 经济高效 − Amazon Redshift 是传统数据仓库实践的经济高效替代方案。没有前期成本,没有长期承诺和按需定价结构。