OPS 4: 如何设计工作负载以便自己了解其状态?
将工作负载设计成能够提供所有组件(例如指标、日志和跟踪信息)的必要信息,以便您了解其内部状态。这让您能够在适当的时候提供有效的响应。
资源
Gaining Better Observability of Your VMs with Amazon CloudWatch
Application Performance Management on AWS
Amazon CloudWatch Documentation
最佳实践:
-
实施应用程序监控: 构建应用程序代码,使其能够提供其内部状态和业务成果实现情况的信息。例如队列深度、错误消息和响应时间。使用这些信息来确定需要在什么时候响应。
-
实施和配置工作负载遥测: 设计和配置工作负载,使其能够提供其内部状态和当前状态的信息。例如 API 调用量、HTTP 状态代码和扩展事件。使用这些信息帮助确定需要在什么时候响应。
-
实施用户活动遥测: 构建应用程序代码,使其能够发出关于用户活动的信息,例如点击流或者开始、放弃和完成的事务。使用这些信息来帮助了解应用程序的使用方式和使用量模式,并确定需要在什么时候响应。
-
实施依赖项遥测: 设计和配置工作负载,使其能够提供关于其依赖的资源状态(例如可访问性或响应时间)的信息。外部依赖项的示例可以包括外部数据库、DNS 和网络连接。使用这些信息来确定需要在什么时候响应。
-
实施事务跟踪: 实施应用程序代码并配置工作负载组件,提供关于工作负载之间的事务流的信息。使用这些信息来确定需要在什么时候做出响应,并帮助您确定导致问题的因素。
改进计划
实施应用程序监控
Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
How Amazon CloudWatch works
What is Amazon CloudWatch?
Using Amazon CloudWatch metrics
What is Amazon CloudWatch Logs?
- 实施应用程序监控:
设计您的应用程序代码,使其能够发出有关其内部状态和业务成果实现情况的信息(例如队列深度、错误消息和响应时间)。
Collect metrics and logs from Amazon EC2 Instances and on-premises servers with the CloudWatch Agent
Using CloudWatch Logs with container instances
Accessing Amazon CloudWatch Logs for AWS Lambda
Publish custom metrics
实施和配置工作负载遥测
Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
How Amazon CloudWatch works
What is Amazon CloudWatch?
Using Amazon CloudWatch metrics
What is Amazon CloudWatch Logs?
- 实施和配置工作负载遥测:
设计和配置工作负载,使其能够发出关于其内部状态和当前状态的信息(例如 API 调用量、HTTP 状态代码和扩展事件)。
Amazon CloudWatch metrics and dimensions reference
AWS CloudTrail
What Is AWS CloudTrail?
VPC Flow Logs
实施用户活动遥测
实施依赖项遥测
Amazon CloudWatch Agent with AWS Systems Manager integration - unified metrics & log collection for Linux & Windows
Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
实施事务跟踪
AWS X-Ray
What is AWS X-Ray?