SAA-C03

Deep Dive

Practicar ahora
D3 · Alto rendimiento

Cómputo: EC2, Lambda, ECS y tipos de instancias

El 24% del examen (D3) evalúa diseño de alto rendimiento. Para cómputo, necesitas elegir el servicio correcto (EC2, Lambda, ECS/EKS) y el tipo de instancia/modelo de compra apropiado para cada escenario.

Icon-Architecture/48/Arch_Amazon-EC2_48

Tipos de instancias EC2

Los tipos de instancias EC2 se organizan en familias según el caso de uso. El prefijo indica la familia, el número la generación, y el sufijo características adicionales (a=AMD,g=GPU,n=networking,i=NVMe SSD,d=HDD).

⚖️

General Purpose (T, M, A1)

Balance de CPU, memoria y red. T = burstable (CPU credits). M = balance constante.

EXAMEN: "App web de propósito general", "microservicio pequeño" → t3.micro, m5.large

Compute Optimized (C)

Alto ratio CPU/memoria. Para workloads que necesitan procesamiento intensivo.

EXAMEN: "Servidor de medios", "batch processing", "gaming servers", "machine learning inference" → c5.xlarge
🧠

Memory Optimized (R, X, High Memory)

Mucha RAM. Para bases de datos in-memory, analytics en tiempo real, big data.

EXAMEN: "Base de datos SAP HANA", "Redis de alto rendimiento", "Spark en memoria" → r5.2xlarge
💾

Storage Optimized (I, D, H)

Alto throughput de I/O local. NVMe SSD (I), HDD de alta densidad (D, H).

EXAMEN: "NoSQL de baja latencia", "data warehouse con acceso frecuente", "Hadoop/HDFS" → i3.xlarge
🎮

Accelerated Computing (P, G, Inf, Trn)

GPUs (P, G) para ML training/inference, rendering 3D. Inferentia/Trainium para ML en AWS.

EXAMEN: "Entrenamiento de modelo de deep learning", "rendering de video" → p3.2xlarge, g4dn
Icon-Architecture/48/Arch_Amazon-EC2_48

Modelos de compra EC2

On-Demand

0% (base)

Precio completo por hora/segundo

Sin compromiso. Pagas solo por lo que usas. Máxima flexibilidad.

Cuándo: Cargas impredecibles, entornos dev/test cortos, primeros deployments.

Reserved Instances (RI)

Hasta 72% con 3 años All Upfront

Hasta 72% descuento vs On-Demand

Compromiso de 1 o 3 años. Standard RI (más descuento), Convertible RI (cambiar familia).

Cuándo: Aplicaciones con carga predecible 24/7. Bases de datos de producción siempre activas.

Savings Plans

EC2 Savings Plans: hasta 72%. Compute: hasta 66% pero aplica a Lambda/Fargate también.

Hasta 66% descuento (Compute) / 72% (EC2)

Compromiso en $/hora durante 1 o 3 años. Aplica a EC2, Lambda, Fargate automáticamente.

Cuándo: Cuando quieres el beneficio de Reserved pero con flexibilidad de tipo de instancia/región.

Spot Instances

Hasta 90% — el descuento más alto

Hasta 90% descuento vs On-Demand

Usa capacidad EC2 no utilizada de AWS. Pueden terminarse con 2 minutos de aviso.

Cuándo: Batch processing, ML training, rendering, CI/CD — cualquier workload tolerante a interrupciones.

Dedicated Hosts

Sin ahorro de precio — valor en compliance y licencias existentes

El más caro (servidor físico completo)

Servidor físico dedicado. Permite usar licencias de software existentes (BYOL: Windows Server, SQL Server).

Cuándo: Compliance que requiere hardware dedicado. Licencias de software por socket/core.

Spot Fleet — mezcla inteligente

Spot Fleet puede combinar múltiples tipos de instancia y AZs para maximizar la capacidad. Si una instancia Spot es reclamada, automáticamente lanza otra del pool disponible. Para batch jobs o ML training: Spot Fleet + diversificación de instancias.

Icon-Architecture/48/Arch_AWS-Lambda_48

AWS Lambda — serverless compute

Lambda ejecuta código sin gestionar servidores. Escalado automático desde 0 hasta miles de ejecuciones simultáneas. Pagas solo por el tiempo de ejecución (milisegundos).

Límites importantes para el examen

Timeout máximo15 minutos
Memory128 MB – 10,240 MB (10 GB)
Ephemeral storage (/tmp)512 MB (extendible a 10 GB)
Deployment package50 MB (zip) / 250 MB (unzip)
Concurrency default1,000 simultáneas por región
vCPUProporcional a memoria (1 vCPU = 1,769 MB)

Fuentes de eventos comunes

API GatewayS3 EventsDynamoDB StreamsSQS/SNSCloudWatch EventsKinesisALBCognito

Cold Start

Primera invocación o tras inactividad: Lambda debe inicializar el entorno (~100ms-1s). Mitigar con Provisioned Concurrency(mantiene N instancias inicializadas) o SnapStart para Java.

Icon-Architecture/48/Arch_Amazon-Elastic-Container-Service_48

ECS, EKS y Fargate

ServicioOrquestaciónGestión de infraCuándo usar
ECS + EC2ECS (nativo AWS)Tú gestionas las instancias EC2Control total sobre el host. Instancias Spot para reducir costos.
ECS + FargateECS (nativo AWS)AWS gestiona la infra (serverless)Sin gestión de servidores. Paga por vCPU/memoria del container.
EKS + EC2KubernetesTú gestionas los nodosPortabilidad Kubernetes. Equipos con experiencia en K8s.
EKS + FargateKubernetesAWS gestiona los nodos (serverless)Kubernetes sin gestionar nodos. Más caro que ECS Fargate.

Señales ECS vs EKS en el examen

Elegir ECS cuando:

  • • "Servicio AWS nativo de containers"
  • • "Sin experiencia previa en Kubernetes"
  • • "Integración nativa con ALB, IAM, CloudWatch"

Elegir EKS cuando:

  • • "Ya usamos Kubernetes on-prem"
  • • "Portabilidad multi-cloud"
  • • "Ecosistema Kubernetes (Helm, operators)"
Icon-Architecture/48/Arch_Amazon-EC2_48

Cuándo usar cada servicio

EscenarioServicioRazón
Procesamiento de imágenes cuando se sube a S3LambdaEvent-driven, corta duración, escala automáticamente
API REST de alta concurrencia sin gestionar servidoresLambda + API GatewayServerless, pago por request, escalado automático
Batch job de ML training que tarda 2 horasEC2 Spot (C o P family)Lambda límite 15 min. Spot para reducir costo hasta 90%
Microservicios containerizados del equipo de AWSECS + FargateNativo AWS, sin gestionar infra, integración nativa
Migrar app Kubernetes de on-prem a AWSEKSMisma API Kubernetes, sin reescribir manifiestos
App web con carga predecible 24/7EC2 Reserved InstancesAhorro hasta 72% vs On-Demand para carga constante
Análisis de datos en lotes durante la nocheEC2 Spot FleetTolerante a interrupciones, máximo ahorro

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa ejecuta trabajos de machine learning training que toman entre 2 y 8 horas. Los trabajos son tolerantes a interrupciones (pueden reiniciarse desde checkpoints). La empresa quiere minimizar costos. ¿Qué configuración de EC2 es más adecuada?