AZ-104

Deep Dive

Practicar ahora
D3 · Cómputo

Disponibilidad y Redundancia de Cómputo

Azure ofrece múltiples opciones para garantizar que las VMs estén disponibles durante fallos de hardware, mantenimiento planificado o desastres de datacenter. El AZ-104 evalúa Availability Sets, Availability Zones y el impacto en SLA.

Icon-compute-21

SLA de cómputo en Azure

ConfiguraciónSLADowntime máx/mesCondiciones
VM única con Premium SSD99.9%~43.8 minOS disk y data disk en Premium SSD o Ultra
VM única con Standard SSD99.5%~3.6 horasOS disk en Standard SSD
Availability Set (2+ VMs)99.95%~21.9 minAl menos 2 VMs en el Availability Set
Availability Zones (2+ VMs en zonas distintas)99.99%~4.38 minAl menos 2 VMs en 2 zonas distintas de la misma región
VMSS (Flexible, multi-zona)99.99%~4.38 minInstancias distribuidas en múltiples Availability Zones

Para el examen — los tres SLAs clave

Memoriza: 99.9% (VM única + Premium SSD) → 99.95% (Availability Set 2+ VMs) → 99.99% (Availability Zones 2+ VMs). Cada tier sube el SLA protegiendo contra una capa diferente de fallo.

Fault Domains y Update Domains

Fault Domain (FD)

Un Fault Domain es un grupo de hardware que comparte fuente de alimentación y switch de red. Si hay un fallo de hardware (power, networking), solo afecta a las VMs en ese FD.

• Un datacenter típico tiene 2-3 FDs

• Las VMs en el mismo Availability Set se distribuyen automáticamente en distintos FDs

• Máximo 3 FDs por Availability Set

• Fallo en FD1 → FD2 y FD3 siguen funcionando

Update Domain (UD)

Un Update Domain es un grupo lógico de VMs que Azure actualiza/reinicia durante el mantenimiento planificado. Azure nunca reinicia dos UDs simultáneamente.

• Azure actualiza un UD a la vez, espera 30 min entre UDs

• Hasta 20 UDs por Availability Set (por defecto 5)

• Mientras un UD está en mantenimiento, las VMs en otros UDs sirven el tráfico

• Si tienes 2 VMs en 2 UDs distintos: siempre hay al menos 1 activa durante mantenimiento

Icon-compute-25

Availability Sets

Un Availability Set agrupa VMs y las distribuye en diferentes Fault Domains y Update Domains dentro de un mismo datacenter. Garantiza que no todas las VMs fallen simultáneamente.

Cómo configurar

1Crear el Availability Set ANTES de crear las VMs (no se puede cambiar después)
2Seleccionar: Fault domains (2 o 3) y Update domains (1-20, default 5)
3Al crear cada VM: seleccionar el Availability Set ya creado
4Azure distribuye automáticamente las VMs en distintos FDs y UDs

Limitaciones de Availability Sets

  • → Protege dentro de un datacenter — si el datacenter entero falla, pierdes todas las VMs
  • → No se puede mover una VM a un AS diferente después de crearla
  • → No es compatible con Availability Zones (son mutuamente excluyentes)
  • → Microsoft recomienda migrar a VMSS Flexible para nuevos workloads

Managed Disk alignment

Con Managed Disks en un Availability Set, los discos también se distribuyen en distintos storage fault domains. Sin esto, múltiples VMs en distintos FDs podrían tener discos en el mismo storage rack y fallar juntos.

Availability Zones

Las Availability Zones son datacenters físicamente separados dentro de una región Azure (cada zona tiene su propia energía, refrigeración y networking independiente). Distribuir VMs entre zonas protege contra fallos de datacenter completo.

Características

• La mayoría de regiones Azure tienen 3 AZs (algunas 2, algunas aún 0)

• Las zonas están a ≥1 km de distancia entre sí (latencia <2ms entre zonas)

• Al crear una VM: seleccionar Zona 1, 2 o 3 explícitamente (o "no preference")

Zone-redundant services: el servicio Azure se distribuye automáticamente entre zonas (ej: ZRS Storage, SQL Hyperscale)

Zonal services: tú eliges en qué zona desplegarlo (VMs, discos, IPs)

• Latencia intra-región entre zonas: <2ms (round trip)

Availability Zones vs Availability Sets

AspectoAv. SetAv. Zones
Protege contraFallo de rack/PDUFallo de datacenter completo
SLA99.95%99.99%
Alcance1 datacenter3 datacenters distintos
Requiere2+ VMs2+ VMs en zonas distintas

Mutuamente excluyentes

Una VM no puede estar en un Availability Set Y en una Availability Zone al mismo tiempo. Elige uno u otro al crear la VM.

Proximity Placement Groups (PPG)

Qué son

Un PPG agrupa VMs en el mismo rack o muy cerca físicamente, minimizando la latencia de red entre ellas. A diferencia de los Availability Sets (que separan las VMs), los PPGs las juntan.

• Latencia típica dentro de PPG: <1ms

• Sin PPG en la misma región: puede haber latencia de 2-5ms

• Compatible con Availability Sets y Availability Zones

Cuándo usar PPG

  • SAP HANA o cualquier BD in-memory que necesite latencia ultra-baja entre app y DB
  • HPC workloads donde la latencia entre nodos es crítica
  • Clusters de alto rendimiento (Redis, Elasticsearch) con comunicación inter-nodo frecuente
  • Aplicaciones financieras (trading) con requisitos de latencia de microsegundos

Trade-off

Menor disponibilidad geográfica. Al concentrar VMs en el mismo rack se aumenta el riesgo de que un único fallo de hardware afecte a todas.

Capacity Reservations

Para qué sirven

Las Capacity Reservations garantizan que Azure tenga capacidad de cómputo reservada para ti en una región y zona específica. Sin reserva, en períodos de alta demanda (desastres regionales, eventos masivos) Azure podría no tener VMs del tamaño que necesitas disponibles.

Con reserva

Azure garantiza capacidad para N VMs del tamaño X

Cobro aunque no estés usando las VMs (pagas la reserva)

Ideal para DR — sabes que al hacer failover habrá capacidad

Sin reserva

Pagas solo por VMs activas

No hay garantía de capacidad en momentos críticos

Puede fallar al crear VMs si el datacenter está lleno

Icon-compute-34

Comparativa de opciones de HA

OpciónProtege contraSLACosto adicionalReemplaza a
Premium SSD (VM única)Fallo de disco99.9%Costo de disco Premium
Availability SetFallo de rack / mantenimiento planificado99.95%GratisN/A (legacy)
Availability ZonesFallo de datacenter completo99.99%Gratis + tráfico cross-zoneMejor que AS
VMSS Flexible multi-zonaFallo de datacenter + escalado automático99.99%Gratis para HA, costo de VMs añadidasAvailability Sets
Proximity Placement GroupLatencia entre VMs (junta, no separa)VariableGratis
Capacity ReservationFalta de capacidad en momentos críticosGarantía de capacidadPagas aunque no uses las VMs

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa tiene 3 VMs que forman la capa web de su aplicación. Necesitan garantizar que la app siga disponible durante el mantenimiento planificado de Azure y durante fallos de hardware de rack. ¿Qué configuración deberían usar?