此内容已过时。此版本的架构完善的框架现在可在以下位置找到: https://docs.aws.amazon.com/zh_cn/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 4: 如何设计工作负载以便自己了解其状态?

将工作负载设计成能够提供所有组件(例如指标、日志和跟踪信息)的必要信息,以便您了解其内部状态。这让您能够在适当的时候提供有效的响应。

资源

Gaining Better Observability of Your VMs with Amazon CloudWatch
Application Performance Management on AWS
Amazon CloudWatch Documentation

最佳实践:

改进计划

实施应用程序监控

  • 实施日志和指标遥测: 构建应用程序代码,使其能够提供其内部状态和业务成果实现情况的信息。使用这些信息来确定需要在什么时候响应。
    Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
    How Amazon CloudWatch works
    What is Amazon CloudWatch?
    Using Amazon CloudWatch metrics
    What is Amazon CloudWatch Logs?
  • 实施和配置工作负载遥测

  • 实施日志和指标遥测: 构建工作负载,使其能够提供其内部状态和业务成果实现情况的信息。使用这些信息来确定需要在什么时候响应。
    Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
    How Amazon CloudWatch works
    What is Amazon CloudWatch?
    Using Amazon CloudWatch metrics
    What is Amazon CloudWatch Logs?
  • 实施用户活动遥测

  • 实施用户活动遥测: 设计应用程序代码,使其能够发出关于用户活动的信息(例如点击流或者开始、放弃和完成的事务。)。使用这些信息来帮助了解应用程序的使用方式和使用量模式,并确定需要在什么时候响应。
  • 实施依赖项遥测

  • 实施依赖项遥测: 设计和配置工作负载,使其能够发出关于其状态及其依赖的系统状态的信息。例如:外部数据库、DNS、网络连接以及外部信用卡处理服务。
    Amazon CloudWatch Agent with AWS Systems Manager integration - unified metrics & log collection for Linux & Windows
    Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
  • 实施事务跟踪

  • 实施事务跟踪: 设计应用程序和工作负载,使其发出有关系统组件间的事务流的信息,例如事务阶段、活动组件以及完成活动的时间。使用这些信息来确定正在进行的活动、已完成的活动以及已完成活动的结果。这可以帮助您确定需要在什么时候响应。例如,组件内的事务响应时间长于预期,这可能表明该组件存在问题。
    AWS X-Ray
    What is AWS X-Ray?