SAA-C03

Deep Dive

Practicar ahora
D3 · Alto rendimiento

Almacenamiento de alto rendimiento: EBS, EFS y S3

El examen SAA-C03 evalúa si sabes elegir el tipo correcto de almacenamiento según el caso de uso: bloque (EBS), archivo compartido (EFS), objeto (S3), o sistemas de archivos gestionados de alto rendimiento (FSx).

Icon-Architecture/48/Arch_Amazon-Elastic-Block-Store_48

EBS — tipos de volúmenes

EBS (Elastic Block Store) son volúmenes de almacenamiento de bloque adjuntos a instancias EC2. Persisten independientemente del ciclo de vida de la instancia. Solo se adjuntan a una instancia a la vez(excepto EBS Multi-Attach para io1/io2).

TipoTecnologíaIOPSThroughputUso
gp3 (SSD)SSD NVMe3,000-16,000 IOPS125-1,000 MB/sDefault para la mayoría. OS, apps, dev/test. Bajo costo.
gp2 (SSD)SSD100-16,000 IOPS128-250 MB/sLegado. Usar gp3 mejor (mismo precio, más IOPS).
io2 Block Express (SSD)NVMe SSDHasta 256,000 IOPSHasta 4,000 MB/sDBs críticas de máximo rendimiento. Multi-Attach.
io1 (SSD)SSD NVMeHasta 64,000 IOPSHasta 1,000 MB/sDBs intensivas en I/O: Oracle, SAP HANA, MySQL.
st1 (HDD)HDDHasta 500 IOPSHasta 500 MB/sBig data, Kafka, logs, acceso secuencial frecuente.
sc1 (HDD)HDDHasta 250 IOPSHasta 250 MB/sDatos fríos, backups, acceso infrecuente. Más barato.

gp3 vs gp2 — siempre gp3

gp3 tiene el mismo precio base que gp2 pero proporciona 3,000 IOPS y 125 MB/s garantizados independientemente del tamaño. gp2 escala IOPS con el tamaño (3 IOPS/GB). Para volúmenes pequeños, gp3 es significativamente mejor.

EBS Multi-Attach (io1/io2)

Permite adjuntar el mismo volumen a múltiples instancias EC2 en la misma AZ. Requiere sistema de archivos cluster-aware (no ext4 estándar). Para aplicaciones de alta disponibilidad que necesitan acceso concurrente (Oracle RAC, Teradata).

Icon-Architecture/48/Arch_Amazon-Simple-Storage-Service_48

S3 — rendimiento y características

S3 escala automáticamente. Cada prefijo en S3 puede manejar al menos 5,500 GET/HEAD y 3,500 PUT/COPY/POST/DELETE por segundo. Distribuir objetos en múltiples prefijos multiplica el throughput.

S3 Transfer Acceleration

Uploads rápidos usando la red global de CloudFront. El cliente sube al Edge Location más cercano; AWS rurea internamente a la región de S3.

EXAMEN: Para uploads de usuarios globales a un bucket centralizado. Ej: clientes en Asia subiendo a us-east-1.

Multipart Upload

Divide archivos grandes en partes y las sube en paralelo. Recomendado para archivos >100 MB, requerido para >5 GB.

EXAMEN: "Subir archivos de 10 GB a S3 de forma eficiente" → Multipart Upload obligatorio.

S3 Byte-Range Fetches

Descarga partes específicas de un archivo en paralelo. Mejora velocidad de descarga de archivos grandes.

EXAMEN: Para descargar solo el header de un archivo grande o acelerar descargas paralelas.

S3 Select y Glacier Select

Ejecuta queries SQL directamente sobre objetos CSV/JSON/Parquet en S3 sin descargar todo el archivo.

EXAMEN: "Procesar solo filas específicas de un CSV de 100 GB" → S3 Select, más barato que descargar todo.
Icon-Architecture/48/Arch_Amazon-EFS_48

EFS — sistema de archivos compartido

EFS (Elastic File System) es un sistema de archivos NFS completamente gestionado. A diferencia de EBS (un volumen por instancia), EFS puede montarse simultáneamente en miles de instancias EC2en múltiples AZs.

Características

  • Compatible con Linux (POSIX). No soporta Windows.
  • Escala automáticamente — no provisionas capacidad
  • Multi-AZ: replicación automática en múltiples AZs
  • Performance modes: General Purpose (default) o Max I/O
  • Throughput modes: Bursting (basado en tamaño) o Provisioned
  • Storage tiers: Standard y EFS-IA (acceso infrecuente, más barato)

Señales EFS en el examen

  • "Múltiples instancias EC2 comparten el mismo sistema de archivos"
  • "Almacenamiento compartido para un servidor web con ASG"
  • "Content management system con múltiples servidores web"
  • "Datos compartidos entre containers en ECS"

EFS vs EBS — elección correcta

EBS = una instancia (bloque). EFS = múltiples instancias simultáneas (archivo). Si el escenario menciona "compartir datos entre instancias" → EFS.

Icon-Architecture/48/Arch_Amazon-FSx_48

FSx — sistemas de archivos gestionados

Amazon FSx for Windows File Server

Sistema de archivos Windows completamente gestionado. Compatibilidad SMB, NTFS, Active Directory. Para apps Windows que necesitan almacenamiento de archivos compartido.

Examen

"Windows workloads", "SQL Server en EC2 necesita almacenamiento compartido", "Integración con Active Directory"

Amazon FSx for Lustre

Sistema de archivos de alto rendimiento para HPC (High Performance Computing), ML y analytics. Integración nativa con S3 — puede importar datos de S3 automáticamente.

Examen

"HPC", "ML training de alta velocidad", "simulaciones científicas", "acceso sub-ms a datos de S3" → FSx for Lustre

Icon-Architecture/48/Arch_Amazon-Elastic-Block-Store_48

Tabla comparativa de almacenamiento

ServicioTipoAccesoMejor para
EBS gp3Bloque SSDUna instancia EC2OS, aplicaciones, bases de datos generales
EBS io2Bloque NVMeUna instancia (Multi-Attach opcional)DBs críticas de alto rendimiento (Oracle, SAP)
EBS st1Bloque HDDUna instancia EC2Big data, Kafka, acceso secuencial
EFSArchivo (NFS)Miles de instancias Linux simultáneasSistemas de archivos compartidos, CMS, home dirs
FSx for WindowsArchivo (SMB)Instancias WindowsApps Windows, AD integration, SQL Server
FSx for LustreArchivo HPCClústers HPC/MLML training, simulaciones científicas
S3ObjetoInternet / AWSImágenes, videos, backups, data lake, logs
S3 GlacierObjeto (archival)S3 API (latencia de min/horas)Archivos de larga retención, cumplimiento

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa tiene un servidor web Linux con un Auto Scaling Group de hasta 10 instancias. Necesitan almacenar archivos de imágenes de usuarios que todos los servidores web puedan leer y escribir simultáneamente. ¿Qué servicio de almacenamiento es más adecuado?