SAA-C03
Deep Dive
El examen SAA-C03 evalúa si sabes elegir el tipo correcto de almacenamiento según el caso de uso: bloque (EBS), archivo compartido (EFS), objeto (S3), o sistemas de archivos gestionados de alto rendimiento (FSx).
Contenido
EBS (Elastic Block Store) son volúmenes de almacenamiento de bloque adjuntos a instancias EC2. Persisten independientemente del ciclo de vida de la instancia. Solo se adjuntan a una instancia a la vez(excepto EBS Multi-Attach para io1/io2).
| Tipo | Tecnología | IOPS | Throughput | Uso |
|---|---|---|---|---|
| gp3 (SSD) | SSD NVMe | 3,000-16,000 IOPS | 125-1,000 MB/s | Default para la mayoría. OS, apps, dev/test. Bajo costo. |
| gp2 (SSD) | SSD | 100-16,000 IOPS | 128-250 MB/s | Legado. Usar gp3 mejor (mismo precio, más IOPS). |
| io2 Block Express (SSD) | NVMe SSD | Hasta 256,000 IOPS | Hasta 4,000 MB/s | DBs críticas de máximo rendimiento. Multi-Attach. |
| io1 (SSD) | SSD NVMe | Hasta 64,000 IOPS | Hasta 1,000 MB/s | DBs intensivas en I/O: Oracle, SAP HANA, MySQL. |
| st1 (HDD) | HDD | Hasta 500 IOPS | Hasta 500 MB/s | Big data, Kafka, logs, acceso secuencial frecuente. |
| sc1 (HDD) | HDD | Hasta 250 IOPS | Hasta 250 MB/s | Datos fríos, backups, acceso infrecuente. Más barato. |
gp3 vs gp2 — siempre gp3
gp3 tiene el mismo precio base que gp2 pero proporciona 3,000 IOPS y 125 MB/s garantizados independientemente del tamaño. gp2 escala IOPS con el tamaño (3 IOPS/GB). Para volúmenes pequeños, gp3 es significativamente mejor.
EBS Multi-Attach (io1/io2)
Permite adjuntar el mismo volumen a múltiples instancias EC2 en la misma AZ. Requiere sistema de archivos cluster-aware (no ext4 estándar). Para aplicaciones de alta disponibilidad que necesitan acceso concurrente (Oracle RAC, Teradata).
S3 escala automáticamente. Cada prefijo en S3 puede manejar al menos 5,500 GET/HEAD y 3,500 PUT/COPY/POST/DELETE por segundo. Distribuir objetos en múltiples prefijos multiplica el throughput.
S3 Transfer Acceleration
Uploads rápidos usando la red global de CloudFront. El cliente sube al Edge Location más cercano; AWS rurea internamente a la región de S3.
Multipart Upload
Divide archivos grandes en partes y las sube en paralelo. Recomendado para archivos >100 MB, requerido para >5 GB.
S3 Byte-Range Fetches
Descarga partes específicas de un archivo en paralelo. Mejora velocidad de descarga de archivos grandes.
S3 Select y Glacier Select
Ejecuta queries SQL directamente sobre objetos CSV/JSON/Parquet en S3 sin descargar todo el archivo.
EFS (Elastic File System) es un sistema de archivos NFS completamente gestionado. A diferencia de EBS (un volumen por instancia), EFS puede montarse simultáneamente en miles de instancias EC2en múltiples AZs.
Características
Señales EFS en el examen
EFS vs EBS — elección correcta
EBS = una instancia (bloque). EFS = múltiples instancias simultáneas (archivo). Si el escenario menciona "compartir datos entre instancias" → EFS.
Amazon FSx for Windows File Server
Sistema de archivos Windows completamente gestionado. Compatibilidad SMB, NTFS, Active Directory. Para apps Windows que necesitan almacenamiento de archivos compartido.
Examen
"Windows workloads", "SQL Server en EC2 necesita almacenamiento compartido", "Integración con Active Directory"
Amazon FSx for Lustre
Sistema de archivos de alto rendimiento para HPC (High Performance Computing), ML y analytics. Integración nativa con S3 — puede importar datos de S3 automáticamente.
Examen
"HPC", "ML training de alta velocidad", "simulaciones científicas", "acceso sub-ms a datos de S3" → FSx for Lustre
| Servicio | Tipo | Acceso | Mejor para |
|---|---|---|---|
| EBS gp3 | Bloque SSD | Una instancia EC2 | OS, aplicaciones, bases de datos generales |
| EBS io2 | Bloque NVMe | Una instancia (Multi-Attach opcional) | DBs críticas de alto rendimiento (Oracle, SAP) |
| EBS st1 | Bloque HDD | Una instancia EC2 | Big data, Kafka, acceso secuencial |
| EFS | Archivo (NFS) | Miles de instancias Linux simultáneas | Sistemas de archivos compartidos, CMS, home dirs |
| FSx for Windows | Archivo (SMB) | Instancias Windows | Apps Windows, AD integration, SQL Server |
| FSx for Lustre | Archivo HPC | Clústers HPC/ML | ML training, simulaciones científicas |
| S3 | Objeto | Internet / AWS | Imágenes, videos, backups, data lake, logs |
| S3 Glacier | Objeto (archival) | S3 API (latencia de min/horas) | Archivos de larga retención, cumplimiento |
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa tiene un servidor web Linux con un Auto Scaling Group de hasta 10 instancias. Necesitan almacenar archivos de imágenes de usuarios que todos los servidores web puedan leer y escribir simultáneamente. ¿Qué servicio de almacenamiento es más adecuado?