PERF 2: In che modo selezioni la soluzione di calcolo?
La soluzione di calcolo ottimale per un determinato carico di lavoro varia in base alla progettazione dell'applicazione, ai modelli di utilizzo e alle impostazioni di configurazione. Le architetture possono utilizzare diverse soluzioni di elaborazione per vari componenti e consentire funzioni diverse per migliorare le prestazioni. Selezionare la soluzione di calcolo sbagliata per un'architettura può portare a una riduzione dell'efficienza delle prestazioni.
Risorse
Amazon EC2 foundations (CMP211-R2)
Powering next-gen Amazon EC2: Deep dive into the Nitro system
Deliver high performance ML inference with AWS Inferentia (CMP324-R1)
Optimize performance and cost for your AWS compute (CMP323-R1)
Better, faster, cheaper compute: Cost-optimizing Amazon EC2 (CMP202-R1)
Cloud Compute with AWS
EC2 Instance Types
Processor State Control for Your EC2 Instance
EKS Containers: EKS Worker Nodes
ECS Containers: Amazon ECS Container Instances
Functions: Lambda Function Configuration
Best practice:
-
Valutazione delle opzioni di elaborazione disponibili: Studia e comprendi le caratteristiche di prestazione delle opzioni relative all'elaborazione disponibili. Comprendi il modo in cui funzionano le istanze, i container e le funzioni e quali siano i vantaggi e gli svantaggi che comportano per il tuo carico di lavoro.
-
Identificazione delle opzioni di configurazione dell'elaborazione disponibili: Comprendi in che modo le varie opzioni completano il tuo carico di lavoro e quali opzioni di configurazione sono le migliori per il tuo sistema. Esempi di tali opzioni includono la famiglia di istanze, le dimensioni, le caratteristiche (GPU, I/O), le dimensioni delle funzioni, le istanze di container, multitenancy o singola, e così via.
-
Raccolta dei parametri relativi all'elaborazione: Uno dei migliori modi per comprendere le prestazioni dei tuoi sistemi di calcolo è registrare e tracciare l'utilizzo effettivo di varie risorse. Questi dati possono essere utilizzati per determinare in modo più accurato i requisiti delle risorse.
-
Definizione della configurazione richiesta in base al corretto dimensionamento: Analizza le varie caratteristiche di prestazione del tuo carico di lavoro e come queste sono correlate a memoria, rete e utilizzo della CPU. Utilizza questi dati per scegliere le risorse che meglio corrispondono al profilo del tuo carico di lavoro. Ad esempio, un carico di lavoro a memoria elevata, come un database, potrebbe essere servito meglio dalla famiglia di istanze r. Al contrario, un carico di lavoro con picchi di prestazioni può trarre maggiori vantaggi da un sistema di container elastici.
-
Utilizzo dell'elasticità disponibile delle risorse: Il cloud offre la flessibilità necessaria per espandere o ridurre le risorse in modo dinamico attraverso una serie di meccanismi per soddisfare i cambiamenti della domanda. Se combinato con parametri relativi all'elaborazione, un carico di lavoro può rispondere automaticamente a questi cambiamenti e utilizzare la gamma di risorse più opportuna per raggiungere il suo obiettivo.
-
Rivalutazione delle esigenze di elaborazione sulla base dei parametri: Utilizza i parametri a livello di sistema per identificare il comportamento e i requisiti del tuo carico di lavoro nel tempo. Valuta le esigenze del tuo carico di lavoro confrontando le risorse disponibili con tali requisiti e apporta modifiche al tuo ambiente di elaborazione per soddisfare al meglio il profilo del carico di lavoro. Ad esempio, nel corso del tempo si potrebbe osservare che un sistema utilizza molta più memoria di quanto si pensasse inizialmente, e trasferirlo a una famiglia o una dimensione di istanze diversa potrebbe migliorarne sia le prestazioni sia l'efficienza.
Piano di miglioramento
Valutazione delle opzioni di elaborazione disponibili
Cloud Compute with AWS
Identificazione delle opzioni di configurazione dell'elaborazione disponibili
AWS Nitro System
Raccolta dei parametri relativi all'elaborazione
Amazon CloudWatch
Definizione della configurazione richiesta in base al corretto dimensionamento
Utilizzo dell'elasticità disponibile delle risorse
Rivalutazione delle esigenze di elaborazione sulla base dei parametri