AI-901

Deep Dive

Practicar ahora
D2 · Machine Learning en Azure

Azure Machine Learning

Azure Machine Learning es la plataforma end-to-end de Microsoft para construir, entrenar, desplegar y gestionar modelos de ML. El AI-901 evalúa sus componentes principales, cuándo usarlo y cómo se diferencia de Azure AI Services.

Icon-166Artboard 1

¿Qué es Azure Machine Learning?

Azure ML es una plataforma cloud para el ciclo de vida completo del machine learning: desde explorar datos hasta desplegar modelos en producción y monitorearlos. Soporta Python, R, y los frameworks más populares (TensorFlow, PyTorch, scikit-learn).

Cuándo usar Azure ML

  • Necesitas entrenar modelos PERSONALIZADOS con tus propios datos
  • Quieres experimentar con múltiples algoritmos y comparar resultados
  • Tienes un equipo de data scientists que escribe código Python/R
  • Necesitas MLOps: versionado de modelos, pipelines automatizados, monitoreo en producción
  • Quieres autoML para seleccionar el mejor algoritmo automáticamente
Icon-166Artboard 1

Workspace y componentes clave

El Workspace es el recurso raíz de Azure ML — un espacio de trabajo que contiene todos los activos del proyecto.

🏗️

Workspace

El contenedor principal. Todo lo demás (datos, experimentos, modelos, endpoints) vive dentro de un workspace.

🗄️

Datastores

Conexiones a almacenamiento de datos (Azure Blob, Azure Data Lake, SQL). Los datos de entrenamiento se leen desde aquí.

📊

Datasets / Data Assets

Versiones registradas de conjuntos de datos. Permite reproducibilidad — saber exactamente con qué datos se entrenó cada modelo.

🧪

Experiments / Jobs

Ejecuciones de entrenamiento. Cada job registra métricas, parámetros, logs y el modelo resultante para comparación.

📦

Model Registry

Catálogo de modelos entrenados con versionado. Permite comparar versiones y promover el mejor modelo a producción.

⚙️

Environments

Definiciones del entorno de ejecución (dependencias Python, versiones de frameworks). Garantizan reproducibilidad.

Tipos de compute en Azure ML

💻

Compute Instance

VM individual para desarrollo e interactivo. Como un Jupyter Notebook en la nube con acceso al workspace. Para exploración de datos y desarrollo de código.

💡

Tu laptop en la nube — siempre encendida, siempre conectada al workspace.

🖥️

Compute Cluster

Clúster de VMs que escala automáticamente de 0 a N nodos según la demanda. Para entrenamiento de modelos que requieren cómputo intensivo o distribuido.

💡

Muchas laptops que aparecen cuando las necesitas y desaparecen cuando terminas. Solo pagas mientras entrenas.

☁️

Serverless Compute

Azure gestiona completamente el compute — no tienes que configurar nada. Escala automáticamente. La opción más sencilla para AutoML y Designer.

💡

No sabes dónde se ejecuta ni cuántas máquinas usa — simplemente funciona.

🔗

Attached Compute

Conectar compute externo (Azure Databricks, HDInsight, AKS, máquinas virtuales) al workspace. Para casos especiales con infraestructura existente.

💡

Traer tu propio hardware al workspace de Azure ML.

AutoML — Machine Learning automatizado

AutoML automatiza la selección de algoritmos y ajuste de hiperparámetros. Tú provees los datos y defines el objetivo (clasificación, regresión, forecasting) — AutoML prueba decenas de combinaciones y te entrega el mejor modelo.

¿Qué automatiza?

1

Selección del algoritmo óptimo (de una lista de candidatos)

2

Ingeniería de características (feature engineering automático)

3

Normalización y transformación de datos

4

Ajuste de hiperparámetros (búsqueda en espacio de parámetros)

5

Ensamble de modelos — combina los mejores para mayor precisión

Tipos de tareas soportadas

Clasificación

Predecir una categoría. Ej: detección de abandono de clientes.

Regresión

Predecir un número. Ej: precio de un producto.

Time Series Forecasting

Predecir valores futuros en series de tiempo. Ej: demanda de inventario.

Visión por computadora

Clasificación de imágenes, detección de objetos. Con datos etiquetados.

NLP

Clasificación de texto, resumen, extracción de información.

Trampa de examen

AutoML no elimina la necesidad de data scientists — automatiza la parte de selección de algoritmos, pero aún necesitas preparar los datos, definir la métrica de éxito, interpretar los resultados e iterar. Es una herramienta de productividad, no un reemplazo completo.

Azure ML Designer — pipelines visuales

Designer es una interfaz drag-and-drop para construir pipelines de ML sin escribir código. Arrastras componentes (cargar datos, transformar, entrenar, evaluar) y los conectas visualmente.

Ideal para

  • Científicos de datos que prefieren flujo visual
  • Prototipado rápido de pipelines de ML
  • Personas con conocimiento de ML pero sin experiencia de código
  • Documentación visual de flujos de ML para equipos

Componentes disponibles

  • Carga de datos desde datastores
  • Transformaciones: normalizar, codificar, dividir datos
  • Algoritmos: regresión, clasificación, clustering
  • Evaluación y visualización de métricas
  • Exportar modelos entrenados al model registry

Endpoints — despliegue de modelos

Una vez entrenado un modelo, se despliega como un endpoint REST para que las aplicaciones puedan consumirlo con predicciones en tiempo real o por lotes.

🚀 Online Endpoint

Predicciones en tiempo real. El cliente envía datos → recibe predicción en milisegundos.

Casos de uso

  • App que predice el precio de envío al hacer checkout
  • Sistema de recomendación que personaliza en tiempo real
  • Detección de fraude en el momento de la transacción

📦 Batch Endpoint

Predicciones en lotes. Procesa grandes volúmenes de datos de forma asíncrona — los resultados se guardan en almacenamiento.

Casos de uso

  • Puntuar todos los clientes mensualmente para campañas de marketing
  • Analizar un año de registros médicos para investigación
  • Clasificar millones de imágenes de inventario en batch nocturno

Azure ML vs Azure AI Services — la distinción clave

La pregunta más frecuente del AI-901

¿Cuándo usar Azure ML y cuándo usar Azure AI Services?

CriterioAzure MLAzure AI Services
Tipo de modeloPersonalizado — entrenas con TUS datosPre-entrenado — ya listo para usar
Requiere data scientistSí (AutoML lo facilita pero no lo elimina)No — solo una API key
Datos de entrenamientoTuyos — necesitas dataset etiquetadoDe Microsoft (entrenado a escala global)
Tiempo de implementaciónSemanas/meses (preparar datos, entrenar, evaluar)Minutos (solo llamar la API)
Caso de uso típicoPredicción de churn específica de tu empresaTraducir texto, detectar objetos en fotos
CostoPor hora de compute de entrenamientoPor número de llamadas a la API

Regla rápida: Si el escenario dice "datos propios", "modelo personalizado" o "características específicas del negocio" → Azure ML. Si dice "usar IA para [tarea general]" sin mencionar datos propios → Azure AI Services.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una startup quiere agregar traducción automática de español a inglés en su app de e-commerce. No tiene datos de entrenamiento propios ni equipo de data scientists. ¿Qué servicio Azure es más apropiado?