AWS ElastiCache - 监控节点指标

为了监控集群的使用情况和运行状况,ElastiCache 提供了可通过 CloudWatch 访问的指标。这些指标可以是主机级指标。CPU 利用率是主机级指标的一个示例。还有一些特定于缓存引擎软件的指标。缓存获取和缓存未命中是引擎特定指标的示例。这些指标以 60 秒为间隔针对每个缓存节点进行测量和发布。

主机级指标

主机级指标衡量 ElastiCache 节点所在主机性能的各个方面。以下是一些重要主机级指标的示例。此外,不同的指标具有不同类型的测量。比如一个指标以百分比来衡量,而另一个指标以计数值来衡量。

指标 描述 单位
CPUUtilization 整个主机的 CPU 利用率百分比。由于 Redis 是单线程的,我们建议您监控 EngineCPUUtilization 指标(如果可用)。 百分比
FreeableMemory 主机上可用的空闲内存量。这是从操作系统报告为可释放的 RAM、缓冲区和缓存中得出的。 字节
SwapUsage 主机上使用的交换量。 字节
NetworkBytesIn 主机从网络读取的字节数。
NetworkBytesOut 实例在所有网络接口上发送的字节数。 字节

引擎级指标

这些指标取决于 ElastiCache 中部署的引擎的类型和版本。它们衡量引擎的性能,根据它们的值,我们可以决定是否更改引擎或重新配置该缓存引擎中的某些参数。每个指标都是在缓存节点级别计算的。以下是一些此类指标的列表。

指标 描述 单位
CacheHits 主字典中成功的只读键查找次数。这来自 keyspace_hits 统计信息。 计数
CacheMisses 主字典中不成功的只读键查找次数。这是从 keyspace_misses 派生而来的。 Count
CurrConnections 客户端连接数,不包括来自只读副本的连接。ElastiCache 在每种情况下使用两到三个连接来监控集群。这是从 Connected_clients 统计数据派生而来的。 Count
EngineCPUUtilization EngineCPUUtilization 提供对 Redis 进程 CPU 利用率的访问,以便更好地了解您的 Redis 工作负载。由于 Redis 是单线程的,并且在任何给定时间点仅使用一个 CPU 核心,因此 EngineCPUUtilization 可以更精确地显示 Redis 进程本身的负载。 百分比
NewConnections 此期间服务器已接受的连接总数。这来自 total_connections_received 统计数据。 计数

监控指标

我们可以查看不同时间段的指标值。例如过去 1 小时或过去 1 天等。为此,我们转到控制台,然后转到 ElastiCache 仪表板。从仪表板中选择集群,然后选择我们要监控其指标的节点的名称。选择节点,然后选中我们要监控的节点名称旁边的复选框。下图显示了弹出的指标窗口。

 monitor Node Metrics 1

进一步向下滚动时,我们会看到更多指标,这些指标以图表的形式呈现,显示了不同时间间隔的值。

 monitor Node Metrics 2