CLF-C02

Deep Dive

Practicar ahora
D3 · Tecnología y servicios en la nube

Almacenamiento: S3, EBS, EFS y Snow Family

AWS ofrece múltiples opciones de almacenamiento para diferentes casos de uso. El CLF-C02 evalúa la capacidad de elegir el servicio correcto según el escenario: S3 para objetos, EBS para volúmenes de EC2, EFS para sistemas de archivos compartidos.

Tipos de almacenamiento AWS

📦

Almacenamiento de objetos

Amazon S3

Archivos planos, accesibles via HTTP. Sin estructura de carpetas real (solo prefijos). Escala infinitamente.

💾

Almacenamiento en bloque

Amazon EBS

Volumen adjunto a una instancia EC2. Como un disco duro virtual. Se formatea con un sistema de archivos.

📁

Almacenamiento de archivos

Amazon EFS

Sistema de archivos NFS compartido. Múltiples instancias EC2 pueden montar el mismo EFS simultáneamente.

Amazon S3 — Simple Storage Service

Icon-Architecture/48/Arch_Amazon-Simple-Storage-Service_48

Almacenamiento de objetos con 11 nines de durabilidad

99.999999999% de durabilidad = si guardas 10 millones de objetos, esperarías perder uno cada 10,000 años

Amazon S3 es almacenamiento de objetos construido para almacenar y recuperar cualquier cantidad de datos desde cualquier lugar. Cada objeto puede tener hasta 5 TB de tamaño. Los objetos se almacenan en buckets con nombres únicos globales.

Características clave de S3

  • Buckets: contenedores de objetos. Nombre único globalmente en AWS. Pertenecen a una región.
  • Versionado: conserva todas las versiones de un objeto. Protege contra eliminación accidental.
  • Hosting web estático: sirve sitios web estáticos directamente desde S3 sin servidores.
  • Pre-signed URLs: URLs temporales para acceso a objetos privados.
  • Lifecycle policies: mueve objetos automáticamente entre clases de almacenamiento según su antigüedad.
  • CRR (Cross-Region Replication): replica objetos a otra región automáticamente (para DR o cumplimiento).

Casos de uso de S3

  • • Almacenar cualquier tipo de archivo: imágenes, videos, backups, logs
  • • Data lakes para análisis con Athena, EMR, Redshift Spectrum
  • • Backup y archivado a largo plazo (Glacier)
  • • Origen de contenido para CloudFront CDN
  • • Hosting de sitios web estáticos
  • • Almacenamiento de artefactos de software y modelos ML
  • • Distribución de software a gran escala

Clases de almacenamiento S3

El examen CLF-C02 evalúa cuándo usar cada clase. La regla general: más barato de almacenar = más caro de recuperar y/o mayor latencia de acceso.

S3 Standard

Acceso: Frecuente
Latencia: Milisegundos
Durabilidad: 11 nines (99.999999999%)
Disponib.: 99.99%
Costo: Más caro por GB almacenado
Cuándo usar: Datos accedidos frecuentemente: contenido web activo, aplicaciones, datos de análisis en tiempo real

S3 Intelligent-Tiering

Acceso: Variable / desconocido
Latencia: Milisegundos
Durabilidad: 11 nines
Disponib.: 99.9%
Costo: Pequeño costo de monitoreo mensual, mueve objetos automáticamente
Cuándo usar: Datos con patrones de acceso desconocidos o cambiantes. AWS mueve automáticamente entre niveles frecuente/infrecuente.

S3 Standard-IA

Acceso: Infrecuente
Latencia: Milisegundos
Durabilidad: 11 nines
Disponib.: 99.9%
Costo: Más barato que Standard. Cobra por cada acceso.
Cuándo usar: Datos de larga duración pero accedidos infrecuentemente: backups, DR, datos de recuperación ante desastres.

S3 One Zone-IA

Acceso: Infrecuente
Latencia: Milisegundos
Durabilidad: 11 nines (una AZ)
Disponib.: 99.5%
Costo: 20% más barato que Standard-IA, pero solo en una AZ
Cuándo usar: Datos secundarios o recreables que no necesitan redundancia multi-AZ: thumbnails, datos que se pueden regenerar.

S3 Glacier Instant Retrieval

Acceso: Archivado (acceso instantáneo cuando se necesita)
Latencia: Milisegundos
Durabilidad: 11 nines
Disponib.: 99.9%
Costo: Barato. Cobra por recuperación.
Cuándo usar: Archivos accedidos 1 vez por trimestre que necesitan recuperación inmediata: archivos médicos, imágenes de noticias.

S3 Glacier Flexible Retrieval

Acceso: Archivado (recuperación en minutos u horas)
Latencia: 1-5 min (Expedited), 3-5h (Standard), 5-12h (Bulk)
Durabilidad: 11 nines
Disponib.: 99.99%
Costo: Muy barato para almacenar. Cobra por recuperación.
Cuándo usar: Backup a largo plazo, archivado de datos históricos que no necesitan acceso inmediato.

S3 Glacier Deep Archive

Acceso: Archivado profundo (recuperación en 12-48h)
Latencia: Standard: 12h, Bulk: 48h
Durabilidad: 11 nines
Disponib.: 99.99%
Costo: El más barato en almacenamiento de todos los tipos S3
Cuándo usar: Datos que deben conservarse 7-10 años por regulación pero raramente se acceden: logs de compliance, datos financieros históricos.

Amazon EBS — Elastic Block Store

Icon-Architecture/48/Arch_Amazon-Elastic-Block-Store_48

Almacenamiento en bloque de alta performance para instancias EC2

Amazon EBS provee volúmenes de almacenamiento en bloque persistente para instancias EC2. Los datos persisten independientemente de la vida de la instancia EC2. Un volumen EBS solo puede estar adjunto a UNA instancia EC2 a la vez (con excepciones: EBS Multi-Attach para io1/io2).

TipoDescripciónIOPSCasos de uso
gp3 (SSD)SSD de propósito general. El estándar recomendado.Hasta 16,000Volúmenes de arranque, apps web, bases de datos de dev/test
gp2 (SSD)SSD de propósito general anterior (en desuso, usar gp3).Hasta 16,000Legacy. gp3 es más barato y flexible.
io2 Block ExpressSSD de IOPS provisionados de alta durabilidad.Hasta 256,000Bases de datos críticas (Oracle, SAP HANA), cargas I/O intensivas
io1 (SSD)SSD de IOPS provisionados. Alta performance.Hasta 64,000Bases de datos transaccionales en producción
st1 (HDD)HDD de throughput optimizado. Para datos accedidos frecuentemente.500 MB/s throughputBig data, data warehouses, log processing
sc1 (HDD)HDD de cold storage. El más económico.250 MB/s throughputBackups, datos accedidos infrecuentemente

Amazon EFS — Elastic File System

Icon-Architecture/48/Arch_Amazon-EFS_48

Sistema de archivos NFS compartido, totalmente gestionado

Amazon EFS proporciona un sistema de archivos NFS (Network File System) simple, sin servidor, elástico, que se puede compartir entre múltiples instancias EC2 simultáneamente, incluso en diferentes Availability Zones.

Ventajas de EFS

  • • Escala automáticamente hasta petabytes
  • • Compartido entre miles de instancias EC2
  • • Sin aprovisionar capacidad por adelantado
  • • Pago por GB almacenado realmente

Limitaciones

  • • Solo para Linux (NFS). No Windows.
  • • Más caro que EBS por GB
  • • Mayor latencia que EBS local

EC2 Instance Store — Almacenamiento temporal

El Instance Store es almacenamiento adjunto físicamente al host de EC2 (no es una red de almacenamiento como EBS). Ofrece muy alta velocidad de E/S, pero los datos se pierden cuando la instancia se detiene o termina.

Características

  • Velocidad: latencia muy baja — almacenamiento local al host físico
  • Efímero: datos SE PIERDEN al detener, terminar o fallar la instancia
  • Sin costo adicional: incluido en el precio de ciertos tipos de instancia
  • No configurable: el tamaño depende del tipo de instancia (no puedes aumentarlo)

Cuándo usar Instance Store

  • • Buffers y cachés temporales
  • • Datos temporales de procesamiento
  • • Scratch space para grandes cómputos
  • • Datos que ya existen en otro lugar (S3, RDS)

Instance Store vs EBS

Instance Store: más rápido, pero efímero (se pierde)

EBS: persiste aunque la instancia se reinicie

• Para datos importantes → siempre EBS (o S3)

Amazon FSx — Sistemas de archivos especializados

Icon-Architecture/48/Arch_Amazon-FSx_48

Sistemas de archivos completamente gestionados para casos de uso específicos

Amazon FSx proporciona sistemas de archivos especializados para casos de uso que EFS no cubre: Windows (SMB), HPC (Lustre), etc. La clave para el examen: EFS = Linux/NFS. FSx = casos de uso específicos.

FSx for Windows File Server

Sistema de archivos SMB compatible con Windows y Active Directory. Ideal para aplicaciones Windows que necesitan almacenamiento de archivos compartido. Soporta DFS, NTFS, Active Directory.

Cuándo usar: Migración de file servers Windows a AWS. Apps .NET que usan file shares SMB.

FSx for Lustre

Sistema de archivos de alto rendimiento para HPC, ML y procesamiento de videos. Diseñado para workloads que requieren cientos de GB/s de throughput y millones de IOPS.

Cuándo usar: HPC, ML training, procesamiento de genómica, análisis financiero de alta velocidad.

FSx for NetApp ONTAP

Compatible con NetApp ONTAP. Para migraciones desde entornos NetApp on-premises a AWS sin cambiar aplicaciones.

Cuándo usar: Empresas con infraestructura NetApp que migran a AWS.

FSx for OpenZFS

Sistema de archivos ZFS gestionado. Snapshots instantáneos, clones de volúmenes y compresión integrada.

Cuándo usar: Workloads Linux que usan ZFS. Migración de servidores ZFS on-premises.

Lifecycle Policies y AWS Backup

S3 Lifecycle Policies

Automatiza la transición de objetos S3 entre clases de almacenamiento según su antigüedad, reduciendo costos sin intervención manual.

S3 Standard30 días →Standard-IA90 días →Glacier365 días →Deep Archive o Delete

Ejemplo: logs de acceso — activos 30 días, archivados 60 días, eliminados después de 1 año. Completamente automatizado.

Icon-Architecture/48/Arch_AWS-Backup_48

AWS Backup

Servicio centralizado de backup para múltiples servicios AWS. Crea políticas de backup (frecuencia, retención, transición a cold storage) que se aplican a EC2, EBS, RDS, DynamoDB, EFS, FSx y más.

  • • Una sola política de backup para múltiples servicios
  • • Backups cross-region y cross-account
  • • Retención configurable (días, semanas, años)
  • • Compliance con marcos como HIPAA, PCI
Icon-Architecture/48/Arch_AWS-Elastic-Disaster-Recovery_48

AWS Elastic Disaster Recovery

Replica servidores on-premises o en cloud (de cualquier origen) a AWS de forma continua. Ante un desastre, permite recuperar en minutos con RPO de segundos y RTO de minutos.

  • • RPO (Recovery Point Objective): segundos
  • • RTO (Recovery Time Objective): minutos
  • • Sin necesidad de hardware de DR propio
  • • Pruebas de DR sin interrumpir producción

AWS Snow Family — Migración masiva de datos

Icon-Architecture/48/Arch_AWS-Snowball_48

Dispositivos físicos para migrar grandes volúmenes de datos a AWS

Cuando tienes petabytes de datos y el ancho de banda de internet es insuficiente (tomaría meses/años), AWS envía un dispositivo físico a tu datacenter. Copias los datos al dispositivo, lo envías de vuelta, AWS los carga en S3.

AWS Snowcone

Capacidad: 8 TB (HDD) / 14 TB (SSD)

Peso: 2.1 kg

Migración de pequeños volúmenes, edge computing en lugares remotos o con restricciones de espacio. Compatible con DataSync.

AWS Snowball Edge

Capacidad: 80 TB (Storage Optimized) / 40 TB (Compute Optimized)

Peso: 22 kg

Migración de decenas de TB. También tiene capacidad de cómputo (EC2, Lambda en el dispositivo). Para edge computing en lugares sin conectividad.

AWS Snowmobile

Capacidad: Hasta 100 PB

Peso: Semirremolque de 45 pies

Migraciones a escala de exabyte. AWS envía un camión a tu datacenter. Para empresas con decenas de petabytes de datos históricos.

S3 vs EBS vs EFS — Comparativa

DimensiónS3EBSEFS
TipoObjetosBloques (volumen)Archivos (NFS)
AccesoAPI REST (HTTP/S)Adjunto a EC2 (block device)Sistema de archivos montado (NFS v4)
ConcurrenciaMillones de clientes simultáneos1 instancia (salvo Multi-Attach)Miles de instancias EC2 simultáneas
Compatibilidad OSCualquiera (HTTP)Linux y WindowsSolo Linux (NFS)
Tamaño máximo objeto5 TB por objeto, ilimitado totalHasta 64 TB por volumenSin límite (escala automático)
Durabilidad11 nines (multi-AZ)99.999% (AZ específica)Multi-AZ (regional)
Casos de usoArchivos, backups, web estático, data lakesSO de EC2, bases de datos, volúmenes de bootCódigo compartido, CMS, web servers multi-instancia
Precio aprox.Desde $0.023/GB/mesDesde $0.08/GB/mes (gp3)Desde $0.30/GB/mes

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa tiene un servidor web con múltiples instancias EC2 en un Auto Scaling Group. Necesitan que todas las instancias compartan el mismo directorio de archivos de configuración y assets de la aplicación. ¿Qué servicio de almacenamiento de AWS es el más adecuado?