AI-901
Deep Dive
Azure Machine Learning es la plataforma end-to-end de Microsoft para construir, entrenar, desplegar y gestionar modelos de ML. El AI-901 evalúa sus componentes principales, cuándo usarlo y cómo se diferencia de Azure AI Services.
Contenido
Azure ML es una plataforma cloud para el ciclo de vida completo del machine learning: desde explorar datos hasta desplegar modelos en producción y monitorearlos. Soporta Python, R, y los frameworks más populares (TensorFlow, PyTorch, scikit-learn).
Cuándo usar Azure ML
El Workspace es el recurso raíz de Azure ML — un espacio de trabajo que contiene todos los activos del proyecto.
Workspace
El contenedor principal. Todo lo demás (datos, experimentos, modelos, endpoints) vive dentro de un workspace.
Datastores
Conexiones a almacenamiento de datos (Azure Blob, Azure Data Lake, SQL). Los datos de entrenamiento se leen desde aquí.
Datasets / Data Assets
Versiones registradas de conjuntos de datos. Permite reproducibilidad — saber exactamente con qué datos se entrenó cada modelo.
Experiments / Jobs
Ejecuciones de entrenamiento. Cada job registra métricas, parámetros, logs y el modelo resultante para comparación.
Model Registry
Catálogo de modelos entrenados con versionado. Permite comparar versiones y promover el mejor modelo a producción.
Environments
Definiciones del entorno de ejecución (dependencias Python, versiones de frameworks). Garantizan reproducibilidad.
Compute Instance
VM individual para desarrollo e interactivo. Como un Jupyter Notebook en la nube con acceso al workspace. Para exploración de datos y desarrollo de código.
Tu laptop en la nube — siempre encendida, siempre conectada al workspace.
Compute Cluster
Clúster de VMs que escala automáticamente de 0 a N nodos según la demanda. Para entrenamiento de modelos que requieren cómputo intensivo o distribuido.
Muchas laptops que aparecen cuando las necesitas y desaparecen cuando terminas. Solo pagas mientras entrenas.
Serverless Compute
Azure gestiona completamente el compute — no tienes que configurar nada. Escala automáticamente. La opción más sencilla para AutoML y Designer.
No sabes dónde se ejecuta ni cuántas máquinas usa — simplemente funciona.
Attached Compute
Conectar compute externo (Azure Databricks, HDInsight, AKS, máquinas virtuales) al workspace. Para casos especiales con infraestructura existente.
Traer tu propio hardware al workspace de Azure ML.
AutoML automatiza la selección de algoritmos y ajuste de hiperparámetros. Tú provees los datos y defines el objetivo (clasificación, regresión, forecasting) — AutoML prueba decenas de combinaciones y te entrega el mejor modelo.
¿Qué automatiza?
Selección del algoritmo óptimo (de una lista de candidatos)
Ingeniería de características (feature engineering automático)
Normalización y transformación de datos
Ajuste de hiperparámetros (búsqueda en espacio de parámetros)
Ensamble de modelos — combina los mejores para mayor precisión
Tipos de tareas soportadas
Clasificación
Predecir una categoría. Ej: detección de abandono de clientes.
Regresión
Predecir un número. Ej: precio de un producto.
Time Series Forecasting
Predecir valores futuros en series de tiempo. Ej: demanda de inventario.
Visión por computadora
Clasificación de imágenes, detección de objetos. Con datos etiquetados.
NLP
Clasificación de texto, resumen, extracción de información.
Trampa de examen
AutoML no elimina la necesidad de data scientists — automatiza la parte de selección de algoritmos, pero aún necesitas preparar los datos, definir la métrica de éxito, interpretar los resultados e iterar. Es una herramienta de productividad, no un reemplazo completo.
Designer es una interfaz drag-and-drop para construir pipelines de ML sin escribir código. Arrastras componentes (cargar datos, transformar, entrenar, evaluar) y los conectas visualmente.
Ideal para
Componentes disponibles
Una vez entrenado un modelo, se despliega como un endpoint REST para que las aplicaciones puedan consumirlo con predicciones en tiempo real o por lotes.
🚀 Online Endpoint
Predicciones en tiempo real. El cliente envía datos → recibe predicción en milisegundos.
Casos de uso
📦 Batch Endpoint
Predicciones en lotes. Procesa grandes volúmenes de datos de forma asíncrona — los resultados se guardan en almacenamiento.
Casos de uso
La pregunta más frecuente del AI-901
¿Cuándo usar Azure ML y cuándo usar Azure AI Services?
| Criterio | Azure ML | Azure AI Services |
|---|---|---|
| Tipo de modelo | Personalizado — entrenas con TUS datos | Pre-entrenado — ya listo para usar |
| Requiere data scientist | Sí (AutoML lo facilita pero no lo elimina) | No — solo una API key |
| Datos de entrenamiento | Tuyos — necesitas dataset etiquetado | De Microsoft (entrenado a escala global) |
| Tiempo de implementación | Semanas/meses (preparar datos, entrenar, evaluar) | Minutos (solo llamar la API) |
| Caso de uso típico | Predicción de churn específica de tu empresa | Traducir texto, detectar objetos en fotos |
| Costo | Por hora de compute de entrenamiento | Por número de llamadas a la API |
Regla rápida: Si el escenario dice "datos propios", "modelo personalizado" o "características específicas del negocio" → Azure ML. Si dice "usar IA para [tarea general]" sin mencionar datos propios → Azure AI Services.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una startup quiere agregar traducción automática de español a inglés en su app de e-commerce. No tiene datos de entrenamiento propios ni equipo de data scientists. ¿Qué servicio Azure es más apropiado?