AI-901

Deep Dive

Practicar ahora
D2 · Machine Learning en Azure

AutoML y Azure ML Designer — ML sin código

Azure ML ofrece dos herramientas para usuarios sin experiencia profunda en ML: AutoML automatiza la selección de algoritmos y Designer proporciona un canvas visual de arrastrar y soltar. El AI-901 evalúa cuándo y cómo usar cada una.

Icon-166Artboard 1

¿Qué es AutoML?

AutoML (Automated Machine Learning) automatiza las partes más técnicas del proceso de ML: probar múltiples algoritmos, ajustar hiperparámetros y seleccionar el mejor modelo — todo sin que el usuario escriba código de ML.

Qué automatiza AutoML

Selección del algoritmo (Random Forest, XGBoost, LightGBM, redes neuronales...)
Feature engineering automático (escalado, codificación, imputación)
Búsqueda de hiperparámetros óptimos
Validación cruzada y evaluación de métricas
Ranking de modelos por métrica objetivo
Generación del mejor modelo para producción

Qué NO automatiza AutoML

La recopilación y limpieza inicial de datos
La definición del problema de negocio
La interpretación de resultados en contexto de negocio
El despliegue y monitoreo en producción (lo hace el data scientist)
La selección de la métrica correcta para el problema

Trampa crítica del examen

AutoML no reemplaza a los data scientists. Democratiza el ML para usuarios de negocio y acelera la experimentación, pero los profesionales siguen siendo necesarios para definir el problema, preparar datos de calidad, interpretar resultados y supervisar modelos en producción.

Proceso de AutoML en Azure ML

1

Preparar dataset

Subir datos a Azure ML como dataset tabular o de series temporales. AutoML requiere datos estructurados (tablas).

2

Configurar experimento

Seleccionar: tipo de tarea (clasificación/regresión/forecasting), columna objetivo (label), métrica de optimización, tiempo máximo de entrenamiento.

3

Seleccionar compute

Elegir Compute Cluster para el entrenamiento paralelo. AutoML entrena múltiples modelos en paralelo si el cluster tiene varios nodos.

4

Ejecución automática

AutoML prueba combinaciones de algoritmos + hiperparámetros. Cada combinación es un "child run" dentro del experimento padre.

5

Revisar resultados

La UI muestra un ranking de modelos con métricas. Se puede explorar explicabilidad (feature importance) de cada modelo.

6

Desplegar el mejor modelo

Un clic para registrar el modelo en el Model Registry y desplegarlo como endpoint de inferencia online o batch.

Tipos de tareas soportadas por AutoML

Clasificación

Predice a qué categoría pertenece una observación.

Ejemplos

¿Este email es spam?
¿El cliente abandonará?
¿Diagnóstico: benigno o maligno?

Métricas

Accuracy, AUC, F1, Precision, Recall

Regresión

Predice un valor numérico continuo.

Ejemplos

Precio de una vivienda
Demanda de energía mañana
Tiempo estimado de entrega

Métricas

RMSE, MAE, R², MAPE

Forecasting (series temporales)

Predice valores futuros basándose en patrones históricos con índice temporal.

Ejemplos

Ventas del próximo mes
Carga de servidores en 24h
Precio de acciones

Métricas

MAPE, RMSE, MAE con horizonte temporal

Computer Vision y NLP con AutoML

AutoML también soporta tareas de imagen (clasificación de imágenes, detección de objetos) y texto (clasificación de texto, NER) entrenando modelos de deep learning. Para el AI-901, el énfasis está en las tareas tabulares clásicas.

Métricas y selección del mejor modelo

AutoML clasifica los modelos candidatos por la métrica de optimización elegida. Debes elegir la métrica correcta según el problema.

EscenarioMétrica recomendadaPor qué
Detección de fraude (clases desbalanceadas)AUC_weightedRobusto con clases desiguales; accuracy engañaría
Clasificación con clases balanceadasAccuracyMétrica más intuitiva cuando las clases son iguales
Diagnóstico médico (minimizar falsos negativos)Recall / F1Más importante no perder positivos (enfermos)
Moderación de spam (minimizar falsos positivos)PrecisionMás importante no bloquear emails legítimos
Predicción de precioRMSE o R²RMSE penaliza errores grandes; R² mide varianza explicada
Predicción de demanda (errores relativos)MAPEError porcentual independiente de la escala
Icon-machinelearning-167

¿Qué es Azure ML Designer?

Designer es el canvas visual de arrastrar y soltar de Azure ML. Permite construir pipelines de ML conectando módulos gráficamente, sin código. Ideal para personas que entienden el proceso de ML pero no quieren (o no pueden) programar.

Para quién es Designer

Business Analysts

Entienden el negocio pero no Python/R.

Data Analysts

Familiares con datos pero no con código de ML.

Aprendices de ML

Visualizar el pipeline ayuda a entender el proceso.

Prototipado rápido

Probar ideas de pipeline antes de codificar.

Limitaciones de Designer

Menos flexible que el SDK (Python/R) para lógica personalizada
Los módulos disponibles son predefinidos — no cualquier algoritmo
Más difícil de versionar en git que código
No es ideal para pipelines de producción de alta complejidad
Curva de aprendizaje para flujos muy grandes (canvas lleno)

Componentes de un pipeline en Designer

📥

Entrada de datos

Dataset (tabular, archivo)Import Data (desde URL o blob)Enter Data Manually (datos de prueba)
🔧

Transformación de datos

Select ColumnsClean Missing DataNormalize DataEdit MetadataSplit Data (train/test)
🧠

Algoritmos de ML

Two-Class Boosted Decision TreeLinear RegressionK-Means ClusteringMulticlass Neural NetworkRandom Forest
📊

Entrenamiento y evaluación

Train ModelScore ModelEvaluate ModelCross Validate Model
🚀

Despliegue

Convert to Inference PipelineDeploy Web ServiceExport Model

AutoML vs Designer vs SDK — ¿cuándo usar qué?

DimensiónAutoMLDesignerSDK / Notebooks
Código requeridoNo (UI) o mínimoNoSí (Python/R)
Control del algoritmoAutomáticoSelección visualTotal
Perfil idealAnalistas, exploración rápidaNo-code, visualizaciónData scientists
FlexibilidadMediaMediaMáxima
Producción a escalaBuenoLimitadoÓptimo
ReproducibilidadAltaMediaMáxima (git)

Trampas frecuentes del examen

¿AutoML elige automáticamente la métrica de optimización correcta?

No. El usuario debe elegir la métrica objetivo según el problema de negocio. AutoML maximiza la métrica que le indiques, pero elegir la métrica incorrecta (ej: accuracy para clases desbalanceadas) producirá un modelo que no sirve aunque la métrica sea alta.

¿AutoML elimina la necesidad de data scientists?

No. AutoML automatiza la selección de algoritmos e hiperparámetros, pero los data scientists siguen siendo necesarios para definir el problema, preparar datos, interpretar resultados y gestionar modelos en producción. AutoML democratiza el ML, no lo reemplaza.

¿Designer y AutoML son lo mismo?

No. Designer es un canvas visual donde tú construyes el pipeline paso a paso conectando módulos. AutoML decide automáticamente qué algoritmos probar y cómo configurarlos. Designer da control visual; AutoML da automatización completa.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa de telecomunicaciones quiere predecir qué clientes cancelarán su suscripción el próximo mes. Tienen un dataset con 500.000 clientes donde solo el 3% canceló históricamente. Un analista de negocio (sin experiencia en Python) va a construir el modelo. ¿Qué herramienta y métrica son más adecuadas?