"このコンテンツは古いものです。現在、このバージョンの Well-Architected Framework は、次の場所にあります。 https://docs.aws.amazon.com/ja_jp/wellarchitected/2022-03-31/framework/operational-excellence.html

OPS 4: どのようにワークロードを設計して、その状態を理解できるようにするのですか?

ワークロードを設計する際には、すべてのコンポーネント (メトリクス、ログ、トレースなど) にわたって内部状態を理解するために必要な情報が送出されるようにします。そうすることによって、適時に有用な返答を提供できるようになります。

リソース

Gaining Better Observability of Your VMs with Amazon CloudWatch
Application Performance Management on AWS
Amazon CloudWatch Documentation

ベストプラクティス:

改善計画

アプリケーションテレメトリーを実装する

  • ログとメトリクステレメトリーを実装する: 内部状態、ステータス、およびビジネス成果の達成に関する情報が送出されるよう、アプリケーションコードをインストルメント化します。この情報を使用して、応答が必要とされるタイミングを特定します。
    Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
    How Amazon CloudWatch works
    What is Amazon CloudWatch?
    Using Amazon CloudWatch metrics
    What is Amazon CloudWatch Logs?
  • ワークロードテレメトリーを実装して設定する

  • ログとメトリクステレメトリーを実装する: 内部状態、ステータス、およびビジネス成果の達成に関する情報が送出されるよう、ワークロードをインストルメント化します。この情報を使用して、応答が必要とされるタイミングを特定します。
    Gaining better observability of your VMs with Amazon CloudWatch - AWS Online Tech Talks
    How Amazon CloudWatch works
    What is Amazon CloudWatch?
    Using Amazon CloudWatch metrics
    What is Amazon CloudWatch Logs?
  • ユーザーアクティビティテレメトリーを実装する

  • ユーザーアクティビティテレメトリーを実装する: ユーザーアクティビティに関する情報 (クリックストリームのほか、開始、放棄、完了済みトランザクションなど) が送出されるよう、アプリケーションコードを設計します。この情報を使用して、アプリケーションの使用方法や使用パターンを理解したり、応答が必要とされるタイミングを特定したりできます。
  • 依存関係のテレメトリーを実装する

  • 依存関係のテレメトリーを実装する: ワークロードが依存するシステムの状態やステータスに関する情報が送出されるよう、ワークロードを設計および設定します。たとえば、外部データベース、DNS、ネットワーク接続、外部クレジットカード処理サービスなどがあります。
    Amazon CloudWatch Agent with AWS Systems Manager integration - unified metrics & log collection for Linux & Windows
    Collect metrics and logs from Amazon EC2 instances and on-premises servers with the CloudWatch Agent
  • トランザクショントレーサビリティを実装する

  • トランザクショントレーサビリティを実装する: トランザクションステージ、アクティブコンポーネント、アクティビティ完了までの時間など、システムコンポーネント全体のトランザクションフローに関する情報を送出するよう、アプリケーションとワークロードを設計します。この情報を使用して、進行中のもの、完了しているもの、および完了したアクティビティの結果を特定できます。これは、応答が必要とされるタイミングを特定するのに役立ちます。例えば、コンポーネント内のトランザクション応答時間が予想より長い場合、そのコンポーネントに問題があることがわかります。
    AWS X-Ray
    What is AWS X-Ray?