AZ-104
Deep Dive
Azure ofrece múltiples opciones para garantizar que las VMs estén disponibles durante fallos de hardware, mantenimiento planificado o desastres de datacenter. El AZ-104 evalúa Availability Sets, Availability Zones y el impacto en SLA.
Contenido
| Configuración | SLA | Downtime máx/mes | Condiciones |
|---|---|---|---|
| VM única con Premium SSD | 99.9% | ~43.8 min | OS disk y data disk en Premium SSD o Ultra |
| VM única con Standard SSD | 99.5% | ~3.6 horas | OS disk en Standard SSD |
| Availability Set (2+ VMs) | 99.95% | ~21.9 min | Al menos 2 VMs en el Availability Set |
| Availability Zones (2+ VMs en zonas distintas) | 99.99% | ~4.38 min | Al menos 2 VMs en 2 zonas distintas de la misma región |
| VMSS (Flexible, multi-zona) | 99.99% | ~4.38 min | Instancias distribuidas en múltiples Availability Zones |
Para el examen — los tres SLAs clave
Memoriza: 99.9% (VM única + Premium SSD) → 99.95% (Availability Set 2+ VMs) → 99.99% (Availability Zones 2+ VMs). Cada tier sube el SLA protegiendo contra una capa diferente de fallo.
Fault Domain (FD)
Un Fault Domain es un grupo de hardware que comparte fuente de alimentación y switch de red. Si hay un fallo de hardware (power, networking), solo afecta a las VMs en ese FD.
• Un datacenter típico tiene 2-3 FDs
• Las VMs en el mismo Availability Set se distribuyen automáticamente en distintos FDs
• Máximo 3 FDs por Availability Set
• Fallo en FD1 → FD2 y FD3 siguen funcionando
Update Domain (UD)
Un Update Domain es un grupo lógico de VMs que Azure actualiza/reinicia durante el mantenimiento planificado. Azure nunca reinicia dos UDs simultáneamente.
• Azure actualiza un UD a la vez, espera 30 min entre UDs
• Hasta 20 UDs por Availability Set (por defecto 5)
• Mientras un UD está en mantenimiento, las VMs en otros UDs sirven el tráfico
• Si tienes 2 VMs en 2 UDs distintos: siempre hay al menos 1 activa durante mantenimiento
Un Availability Set agrupa VMs y las distribuye en diferentes Fault Domains y Update Domains dentro de un mismo datacenter. Garantiza que no todas las VMs fallen simultáneamente.
Cómo configurar
Limitaciones de Availability Sets
Managed Disk alignment
Con Managed Disks en un Availability Set, los discos también se distribuyen en distintos storage fault domains. Sin esto, múltiples VMs en distintos FDs podrían tener discos en el mismo storage rack y fallar juntos.
Las Availability Zones son datacenters físicamente separados dentro de una región Azure (cada zona tiene su propia energía, refrigeración y networking independiente). Distribuir VMs entre zonas protege contra fallos de datacenter completo.
Características
• La mayoría de regiones Azure tienen 3 AZs (algunas 2, algunas aún 0)
• Las zonas están a ≥1 km de distancia entre sí (latencia <2ms entre zonas)
• Al crear una VM: seleccionar Zona 1, 2 o 3 explícitamente (o "no preference")
• Zone-redundant services: el servicio Azure se distribuye automáticamente entre zonas (ej: ZRS Storage, SQL Hyperscale)
• Zonal services: tú eliges en qué zona desplegarlo (VMs, discos, IPs)
• Latencia intra-región entre zonas: <2ms (round trip)
Availability Zones vs Availability Sets
| Aspecto | Av. Set | Av. Zones |
|---|---|---|
| Protege contra | Fallo de rack/PDU | Fallo de datacenter completo |
| SLA | 99.95% | 99.99% |
| Alcance | 1 datacenter | 3 datacenters distintos |
| Requiere | 2+ VMs | 2+ VMs en zonas distintas |
Mutuamente excluyentes
Una VM no puede estar en un Availability Set Y en una Availability Zone al mismo tiempo. Elige uno u otro al crear la VM.
Qué son
Un PPG agrupa VMs en el mismo rack o muy cerca físicamente, minimizando la latencia de red entre ellas. A diferencia de los Availability Sets (que separan las VMs), los PPGs las juntan.
• Latencia típica dentro de PPG: <1ms
• Sin PPG en la misma región: puede haber latencia de 2-5ms
• Compatible con Availability Sets y Availability Zones
Cuándo usar PPG
Trade-off
Menor disponibilidad geográfica. Al concentrar VMs en el mismo rack se aumenta el riesgo de que un único fallo de hardware afecte a todas.
Para qué sirven
Las Capacity Reservations garantizan que Azure tenga capacidad de cómputo reservada para ti en una región y zona específica. Sin reserva, en períodos de alta demanda (desastres regionales, eventos masivos) Azure podría no tener VMs del tamaño que necesitas disponibles.
Con reserva
• Azure garantiza capacidad para N VMs del tamaño X
• Cobro aunque no estés usando las VMs (pagas la reserva)
• Ideal para DR — sabes que al hacer failover habrá capacidad
Sin reserva
• Pagas solo por VMs activas
• No hay garantía de capacidad en momentos críticos
• Puede fallar al crear VMs si el datacenter está lleno
| Opción | Protege contra | SLA | Costo adicional | Reemplaza a |
|---|---|---|---|---|
| Premium SSD (VM única) | Fallo de disco | 99.9% | Costo de disco Premium | — |
| Availability Set | Fallo de rack / mantenimiento planificado | 99.95% | Gratis | N/A (legacy) |
| Availability Zones | Fallo de datacenter completo | 99.99% | Gratis + tráfico cross-zone | Mejor que AS |
| VMSS Flexible multi-zona | Fallo de datacenter + escalado automático | 99.99% | Gratis para HA, costo de VMs añadidas | Availability Sets |
| Proximity Placement Group | Latencia entre VMs (junta, no separa) | Variable | Gratis | — |
| Capacity Reservation | Falta de capacidad en momentos críticos | Garantía de capacidad | Pagas aunque no uses las VMs | — |
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa tiene 3 VMs que forman la capa web de su aplicación. Necesitan garantizar que la app siga disponible durante el mantenimiento planificado de Azure y durante fallos de hardware de rack. ¿Qué configuración deberían usar?