1. 指标收集和跟踪
监控 AWS 资源(如 EC2、RDS 和 Lambda)的 CPU 使用 乐队数据库 内存利用率、磁盘 I/O 和网络活动等指标。
指标通常存储在 Amazon EC2 存储桶中并作为指标存储库。
2. 监测系统
各种监控系统,例如应用程序、网络和基础设施监控。
应用程序监控重点关注应用程序的健康状况,例如延迟、可用性和故障。
网络监控具有互联网监控和网络监控,用于跟踪全球(互联网)流量和混合(本地与云)延迟和数据包丢失。
基础设施监控可以包括对容器(Amazon Elastic 和 Kubernetes)的资源使用情况(例如 CPU、内存等)的洞察。它还可以跟踪您的 AWS Lambda 应用程序的相同指标。
3. 实时仪表板
提供可定制的仪表板,用于实时可视化系统性能和趋势。
可以展示所选的自定义应用程序和指标

CloudWatch 仪表板:Amazon 文档
4. 警报和阈值
设置警报来检测和响应性能异常,自动触发操作或发送警报。
一些操作,包括启动更多实例或停止未充分利用的实例。
AWS CloudWatch 使用案例
让我们看一下 AWS CloudWatch 的一些具体用例。
性能优化
AWS CloudWatch 有助于识别瓶颈并优化资源使用。例如,Internet Monitor可以检测全球云游戏平台上的延迟问题,并建议在更优化的区域部署服务器以减少延迟。
自动警报
根据预定义阈值设置警报,以进行资源扩展或错误检测。例如,当应用程序的服务级别目标(SLO) 未得到满足时,CloudWatch 可以发送警报并提供可操作的建议来增强性能指标。
持续可见性
使用仪表板来实时了解系统运行状况。仪表板对于跟踪 AWS Kinesis和AWS Lambda等服务的数据流性能特别有用。了解此过程的一个好方法是学习使用 AWS Kinesis 和 Lambda 进行流式传输数据的课程,该课程最终将指导您使用 AWS CloudWatch 构建仪表板。