Amazon RDS - 数据库监控

为了保持 Amazon RDS 的可靠性、可用性和性能,我们需要收集监控数据,以便轻松调试多点故障。使用 Amazon RDS,您可以监控网络吞吐量、读取、写入和/或元数据操作的 I/O、客户端连接以及数据库实例的突发信用余额。我们还应考虑存储历史监控数据。这些存储的数据将为您提供与当前性能数据进行比较的基准。

以下是一些监控数据的示例以及它们如何帮助维护健康的 RDS 实例。

  • 高 CPU 或 RAM 消耗 – 高 CPU 或 RAM 消耗值可能是合适的,前提是它们符合您对应用程序的目标(如吞吐量或并发性)并且是预期的。

  • 磁盘空间消耗 – 如果使用的空间始终等于或高于总磁盘空间的 85%,则调查磁盘空间消耗。查看是否可以从实例中删除数据或将数据存档到其他系统以释放空间。

  • 网络流量 – 对于网络流量,请与系统管理员沟通,了解域网络和 Internet 连接的预期吞吐量。如果吞吐量始终低于预期,请调查网络流量。

  • 数据库连接 – 如果您发现用户连接数量较多,同时实例性能和响应时间下降,请考虑限制数据库连接。

  • IOPS 指标 – IOPS 指标的预期值取决于磁盘规格和服务器配置,因此请使用基准来了解典型值。调查值是否始终与基准不同。为获得最佳 IOPS 性能,请确保您的典型工作集适合内存,以最大限度地减少读写操作。

使用 Amazon CloudWatch 进行监控

Amazon RDS 每分钟向 Amazon CloudWatch 发送一次指标和维度。我们可以从 AWS 控制台监控这些指标,如下图所示。

 surveillance_matrices.jpg