AZ-104
Deep Dive
Estrategias y herramientas para optimizar el rendimiento, monitoreo y costos de máquinas virtuales en Azure. El AZ-104 evalúa diagnósticos de rendimiento, Accelerated Networking, VMs Burstable y Update Manager.
Contenido
Métricas disponibles por defecto (Host)
Métricas de OS (requieren Azure Monitor Agent)
Con Azure Monitor Agent (AMA) instalado y un Data Collection Rule (DCR) configurado, se recopilan métricas del SO:
•Memoria disponible y usada (Windows y Linux)
•CPU por proceso, por core lógico
•Disco: espacio libre por volumen, latencia, cola de E/S
•Red: paquetes enviados/recibidos, errores
•Contadores de rendimiento personalizados de Windows
•Syslog y event logs de Windows
Conceptos clave de rendimiento de disco
IOPS (Input/Output Operations Per Second)
Número de operaciones de lectura/escritura por segundo. Crítico para DBs OLTP con muchas transacciones pequeñas.
Throughput (MB/s)
Cantidad de datos transferidos por segundo. Crítico para operaciones de lectura secuencial grande (ETL, analytics, video).
Latencia (ms)
Tiempo hasta que una operación de I/O se completa. Ultra Disk y Premium SSD v2 garantizan <1ms. Premium SSD <10ms.
Disk Bursting
Premium SSD y Standard SSD soportan bursting: pueden superar temporalmente su IOPS/throughput aprovisionado usando créditos acumulados durante períodos de baja actividad.
• On-demand bursting (Premium SSD P30+): burst ilimitado, pagas por las IOPS extras usadas
• Credit-based bursting (Premium SSD P1-P20): acumulas créditos, límite de tiempo
• Las VMs también tienen sus propios límites de burst (por VM size)
Write Accelerator (VMs M-series)
Feature exclusivo de VMs M-series (memoria optimizada) para discos de redo/transaction logs de SAP HANA y SQL Server. Reduce drásticamente la latencia de escritura en logs al mantenerlos en caché de escritura de alta velocidad.
VM + Disk IOPS ceiling — el límite más restrictivo gana
El rendimiento real de un disco está limitado por el mínimo entre el límite del disco Y el límite de la VM. Si tienes un Premium SSD P30 (5.000 IOPS) en una Standard_D2s_v3 (3.200 IOPS máx), solo obtienes 3.200 IOPS.
Bottleneck común: comprar disco Premium SSD pero poner una VM pequeña. El disco tiene más capacidad que la VM puede aprovechar. Verificar siempre los límites de IOPS/throughput del tamaño de VM elegido.
Accelerated Networking (AN)
Habilita SR-IOV (Single Root I/O Virtualization) en la VM: el NIC virtual accede directamente al hardware de red sin pasar por el hypervisor. Reduce latencia y jitter, aumenta throughput.
• Sin AN: paquetes van VM → hypervisor → switch virtual → NIC física
• Con AN: paquetes van VM → NIC física directamente (SR-IOV bypass)
• Latencia típica: sin AN ~100μs, con AN ~25μs
• Throughput: hasta 30 Gbps con AN vs mucho menos sin él
• Habilitado automáticamente en VMs compatibles (D/E/F/M series v3/v4/v5)
Límites de red por VM size
Cada tamaño de VM tiene un límite de ancho de banda de red (en Mbps o Gbps). Usar más NICs no supera el límite del tamaño — el límite es del host físico compartido por todas las NICs.
| VM Size | Max NICs | Bandwidth |
|---|---|---|
| B2s | 2 | 600 Mbps |
| D4s_v5 | 4 | 12.5 Gbps |
| D16s_v5 | 8 | 12.5 Gbps |
| E32s_v5 | 8 | 16 Gbps |
Cómo funcionan los créditos
Las VMs B-series tienen un baseline de CPU (ej: B2s = 40% baseline). Cuando usas MENOS que el baseline, acumulas créditos. Cuando necesitas más CPU, gastas créditos para "burst" hasta el 100%.
• Cada crédito = 1 minuto de uso de CPU al 100% de 1 core
• Acumulación: según el tamaño (B1s acumula 6 créditos/hora)
• Máximo de créditos acumulados: varía por tamaño (B1s: 144 créditos = 24h de acumulación)
• Sin créditos: la VM está limitada al baseline — no puede hacer burst
Tabla de B-series populares
| VM | vCPUs | RAM | Baseline | Cred/hora |
|---|---|---|---|---|
| B1s | 1 | 1 GB | 10% | 6 |
| B2s | 2 | 4 GB | 40% | 24 |
| B4ms | 4 | 16 GB | 90% | 54 |
| B8ms | 8 | 32 GB | 135% | 81 |
Cuándo NO usar B-series
Cargas de CPU sostenida (compilación, rendering, ML, DB con carga constante). Los créditos se agotan y la VM queda limitada al baseline.
Servicio para gestionar actualizaciones del OS de VMs Azure y on-premises (via Azure Arc). Reemplaza a Update Management de Azure Automation.
Funcionalidades
Patch Orchestration Modes
Manual
El OS aplica parches solo cuando el usuario lo inicia manualmente. Azure no interviene.
AutomaticByOS
Windows Update o yum/apt decide cuándo parchear según su propio schedule.
AutomaticByPlatform
Azure Update Manager gestiona el schedule. Permite ventanas de mantenimiento. Recomendado.
ImageDefault
Usa el modo configurado en la imagen del OS. Variable.
VM Insights
Panel pre-configurado en Azure Monitor con métricas de rendimiento (CPU, disco, red, memoria) y mapa de dependencias entre VMs. Requiere Azure Monitor Agent.
VM → Insights → Enable. Provisiona AMA y Log Analytics Workspace automáticamente.
Boot Diagnostics
Captura screenshots de la consola y el log de arranque. Imprescindible para diagnosticar VMs que no arrancan o que quedan en pantalla azul (BSOD).
VM → Boot diagnostics → Enable. Guarda en Storage Account (managed o propio).
Azure Diagnostics Extension
Extension legacy para enviar métricas de OS a Azure Monitor. Siendo reemplazada por Azure Monitor Agent (AMA). Aún relevante para métricas de guest OS en tiempo real.
VM → Diagnostic settings → Enable. Seleccionar Storage Account o Log Analytics.
| Estrategia | Ahorro potencial | Trade-off | Cuándo aplicar |
|---|---|---|---|
| Reserved Instances (1 año) | ~40% | Compromiso de 1 año. Cancelación con penalización. | VMs de producción estables, uso constante |
| Reserved Instances (3 años) | ~63% | Compromiso de 3 años. | Cargas de largo plazo muy predecibles |
| Azure Hybrid Benefit | ~49% en licencia OS | Requiere licencias Windows Server con SA. | Si ya tienes licencias on-prem |
| Spot VMs | Hasta 90% | Sin SLA. Azure puede detener con 30 seg de aviso. | Batch jobs, CI/CD, dev/test, renders |
| Auto-shutdown | Proporcional a horas apagadas | VMs no disponibles fuera del horario. | VMs de dev/test que no se usan 24/7 |
| Rightsizing | Variable (5-40% típico) | Necesita análisis previo de métricas. | VMs sobredimensionadas con CPU < 20% constante |
Azure Advisor — recomendaciones automáticas
Azure Advisor analiza tu uso y genera recomendaciones de costo. Para VMs: identifica VMs infrautilizadas (CPU < 5%) y sugiere redimensionar o apagar.
→ Portal → Advisor → Cost → recomendaciones de VM
→ También monitorea: Reserved Instances subutilizadas, discos huérfanos (sin VM)
→ Estima el ahorro mensual de cada recomendación
Azure Dev/Test Labs
Entorno gestionado para equipos de desarrollo. Permite auto-shutdown programado, límites de costo por usuario, imágenes pre-configuradas, y precios de Spot para VMs de dev.
→ Precio reducido: las VMs de Dev/Test tienen descuento en licencias Windows
→ Cuotas: limitar el número de VMs por usuario y el costo máximo mensual
→ Políticas: forzar auto-shutdown a las 19:00 si nadie conectado
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Un equipo de desarrollo tiene 20 VMs que solo se usan de lunes a viernes entre las 9:00 y las 18:00. Las VMs corren sobre Windows Server. La empresa tiene licencias de Windows Server con Software Assurance. ¿Qué combinación de estrategias maximiza el ahorro?