Amazon Web Services - Redshift
Amazon Redshift 是一种完全托管的云数据仓库服务。其数据集从数百 GB 到 1 PB 不等。创建数据仓库的初始过程是启动一组称为 节点 的计算资源,这些资源被组织成称为 集群 的组。之后,您可以处理查询。
如何设置 Amazon Redshift?
以下是设置 Amazon Redshift 的步骤。
步骤 1 − 使用以下步骤登录并启动 Redshift 集群。
登录 AWS 管理控制台并使用以下链接打开 Amazon Redshift 控制台 − https://console.aws.amazon.com/redshift/
使用屏幕右上角的区域菜单选择要创建集群的区域。
单击启动集群按钮。

将打开"集群详细信息"页面。提供所需的详细信息,然后单击"继续"按钮,直到进入审核页面。

将打开一个确认页面。单击"关闭"按钮完成,以便集群在集群列表中可见。

在列表中选择集群并查看集群状态信息。该页面将显示集群状态。

第 2 步 −配置安全组以授权客户端连接到集群。授权访问 Redshift 取决于客户端是否授权 EC2 实例。
按照以下步骤在 EC2-VPC 平台上配置安全组。
打开 Amazon Redshift 控制台并单击导航窗格上的集群。
选择所需的集群。其配置选项卡打开。

单击安全组。
打开安全组页面后,单击入站选项卡。

单击编辑按钮。设置如下所示的字段,然后单击保存按钮。
类型 − 自定义 TCP 规则。
协议 − TCP。
端口范围 −输入启动集群时使用的相同端口号。Amazon Redshift 的默认端口为 5439。
来源 − 选择自定义 IP,然后输入 0.0.0.0/0。

步骤 3 − 连接到 Redshift 集群。
有两种方法可以连接到 Redshift 集群 − 直接或通过 SSL。
以下是直接连接的步骤。
使用 SQL 客户端工具连接集群。它支持与 PostgreSQL JDBC 或 ODBC 驱动程序兼容的 SQL 客户端工具。
使用以下链接下载 − JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip 或适用于 64 位计算机的 http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip
使用以下步骤获取连接字符串。
打开 Amazon Redshift 控制台并在导航窗格中选择集群。
选择所需的集群并单击配置选项卡。
将打开一个页面,如以下屏幕截图所示,其中集群数据库属性下有 JDBC URL。复制 URL。

使用以下步骤将 Cluster 与 SQL Workbench/J 连接。
打开 SQL Workbench/J。
选择文件并单击连接窗口。
选择创建新的连接配置文件并填写所需的详细信息,如名称等。
单击管理驱动程序,管理驱动程序对话框将打开。
单击创建新条目按钮并填写所需的详细信息。

单击文件夹图标并导航到驱动程序位置。最后,单击"打开"按钮。

将"类名"框和"示例 URL"框留空。单击"确定"。
从列表中选择驱动程序。
在 URL 字段中,粘贴复制的 JDBC URL。
在相应的字段中输入用户名和密码。
选择"自动提交"框并单击"保存配置文件列表"。

Amazon Redshift 的功能
以下是 Amazon Redshift 的功能 −
支持 VPC −用户可以在 VPC 内启动 Redshift,并通过虚拟网络环境控制对集群的访问。
加密 − 在 Redshift 中创建表时,可以加密和配置存储在 Redshift 中的数据。
SSL − SSL 加密用于加密客户端和 Redshift 之间的连接。
可扩展 − 只需单击几下,即可根据需要轻松扩展 Redshift 数据仓库中的节点数量。它还允许扩展存储容量而不会造成任何性能损失。
经济高效 − Amazon Redshift 是传统数据仓库实践的经济高效替代方案。没有前期成本,没有长期承诺和按需定价结构。