AI-901

Deep Dive

D2 · Machine Learning en Azure

AutoML y Azure ML Designer — ML sin código

Azure ML ofrece dos herramientas para usuarios sin experiencia profunda en ML: AutoML automatiza la selección de algoritmos y Designer proporciona un canvas visual de arrastrar y soltar. El AI-901 evalúa cuándo y cómo usar cada una.

Contenido

¿Qué es AutoML?
Proceso de AutoML
Tipos de tareas soportadas
Métricas y selección de modelo
¿Qué es Azure ML Designer?
Componentes y pipelines
AutoML vs Designer vs SDK
Trampas frecuentes del examen

¿Qué es AutoML?

AutoML (Automated Machine Learning) automatiza las partes más técnicas del proceso de ML: probar múltiples algoritmos, ajustar hiperparámetros y seleccionar el mejor modelo — todo sin que el usuario escriba código de ML.

Qué automatiza AutoML

Selección del algoritmo (Random Forest, XGBoost, LightGBM, redes neuronales...)

Feature engineering automático (escalado, codificación, imputación)

Búsqueda de hiperparámetros óptimos

Validación cruzada y evaluación de métricas

Ranking de modelos por métrica objetivo

Generación del mejor modelo para producción

Qué NO automatiza AutoML

La recopilación y limpieza inicial de datos

La definición del problema de negocio

La interpretación de resultados en contexto de negocio

El despliegue y monitoreo en producción (lo hace el data scientist)

La selección de la métrica correcta para el problema

Trampa crítica del examen

AutoML no reemplaza a los data scientists. Democratiza el ML para usuarios de negocio y acelera la experimentación, pero los profesionales siguen siendo necesarios para definir el problema, preparar datos de calidad, interpretar resultados y supervisar modelos en producción.

Proceso de AutoML en Azure ML

Preparar dataset

Subir datos a Azure ML como dataset tabular o de series temporales. AutoML requiere datos estructurados (tablas).

Configurar experimento

Seleccionar: tipo de tarea (clasificación/regresión/forecasting), columna objetivo (label), métrica de optimización, tiempo máximo de entrenamiento.

Seleccionar compute

Elegir Compute Cluster para el entrenamiento paralelo. AutoML entrena múltiples modelos en paralelo si el cluster tiene varios nodos.

Ejecución automática

AutoML prueba combinaciones de algoritmos + hiperparámetros. Cada combinación es un "child run" dentro del experimento padre.

Revisar resultados

La UI muestra un ranking de modelos con métricas. Se puede explorar explicabilidad (feature importance) de cada modelo.

Desplegar el mejor modelo

Un clic para registrar el modelo en el Model Registry y desplegarlo como endpoint de inferencia online o batch.

Tipos de tareas soportadas por AutoML

Clasificación

Predice a qué categoría pertenece una observación.

Ejemplos

¿Este email es spam?

¿El cliente abandonará?

¿Diagnóstico: benigno o maligno?

Métricas

Accuracy, AUC, F1, Precision, Recall

Regresión

Predice un valor numérico continuo.

Ejemplos

Precio de una vivienda

Demanda de energía mañana

Tiempo estimado de entrega

Métricas

RMSE, MAE, R², MAPE

Forecasting (series temporales)

Predice valores futuros basándose en patrones históricos con índice temporal.

Ejemplos

Ventas del próximo mes

Carga de servidores en 24h

Precio de acciones

Métricas

MAPE, RMSE, MAE con horizonte temporal

Computer Vision y NLP con AutoML

AutoML también soporta tareas de imagen (clasificación de imágenes, detección de objetos) y texto (clasificación de texto, NER) entrenando modelos de deep learning. Para el AI-901, el énfasis está en las tareas tabulares clásicas.

Métricas y selección del mejor modelo

AutoML clasifica los modelos candidatos por la métrica de optimización elegida. Debes elegir la métrica correcta según el problema.

Escenario	Métrica recomendada	Por qué
Detección de fraude (clases desbalanceadas)	`AUC_weighted`	Robusto con clases desiguales; accuracy engañaría
Clasificación con clases balanceadas	`Accuracy`	Métrica más intuitiva cuando las clases son iguales
Diagnóstico médico (minimizar falsos negativos)	`Recall / F1`	Más importante no perder positivos (enfermos)
Moderación de spam (minimizar falsos positivos)	`Precision`	Más importante no bloquear emails legítimos
Predicción de precio	`RMSE o R²`	RMSE penaliza errores grandes; R² mide varianza explicada
Predicción de demanda (errores relativos)	`MAPE`	Error porcentual independiente de la escala

¿Qué es Azure ML Designer?

Designer es el canvas visual de arrastrar y soltar de Azure ML. Permite construir pipelines de ML conectando módulos gráficamente, sin código. Ideal para personas que entienden el proceso de ML pero no quieren (o no pueden) programar.

Para quién es Designer

Business Analysts

Entienden el negocio pero no Python/R.

Data Analysts

Familiares con datos pero no con código de ML.

Aprendices de ML

Visualizar el pipeline ayuda a entender el proceso.

Prototipado rápido

Probar ideas de pipeline antes de codificar.

Limitaciones de Designer

Menos flexible que el SDK (Python/R) para lógica personalizada

Los módulos disponibles son predefinidos — no cualquier algoritmo

Más difícil de versionar en git que código

No es ideal para pipelines de producción de alta complejidad

Curva de aprendizaje para flujos muy grandes (canvas lleno)

Componentes de un pipeline en Designer

📥

Entrada de datos

Dataset (tabular, archivo)Import Data (desde URL o blob)Enter Data Manually (datos de prueba)

🔧

Transformación de datos

Select ColumnsClean Missing DataNormalize DataEdit MetadataSplit Data (train/test)

🧠

Algoritmos de ML

Two-Class Boosted Decision TreeLinear RegressionK-Means ClusteringMulticlass Neural NetworkRandom Forest

📊

Entrenamiento y evaluación

Train ModelScore ModelEvaluate ModelCross Validate Model

🚀

Despliegue

Convert to Inference PipelineDeploy Web ServiceExport Model

AutoML vs Designer vs SDK — ¿cuándo usar qué?

Dimensión	AutoML	Designer	SDK / Notebooks
Código requerido	No (UI) o mínimo	No	Sí (Python/R)
Control del algoritmo	Automático	Selección visual	Total
Perfil ideal	Analistas, exploración rápida	No-code, visualización	Data scientists
Flexibilidad	Media	Media	Máxima
Producción a escala	Bueno	Limitado	Óptimo
Reproducibilidad	Alta	Media	Máxima (git)

Trampas frecuentes del examen

❓ ¿AutoML elige automáticamente la métrica de optimización correcta?

No. El usuario debe elegir la métrica objetivo según el problema de negocio. AutoML maximiza la métrica que le indiques, pero elegir la métrica incorrecta (ej: accuracy para clases desbalanceadas) producirá un modelo que no sirve aunque la métrica sea alta.

❓ ¿AutoML elimina la necesidad de data scientists?

No. AutoML automatiza la selección de algoritmos e hiperparámetros, pero los data scientists siguen siendo necesarios para definir el problema, preparar datos, interpretar resultados y gestionar modelos en producción. AutoML democratiza el ML, no lo reemplaza.

❓ ¿Designer y AutoML son lo mismo?

No. Designer es un canvas visual donde tú construyes el pipeline paso a paso conectando módulos. AutoML decide automáticamente qué algoritmos probar y cómo configurarlos. Designer da control visual; AutoML da automatización completa.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa de telecomunicaciones quiere predecir qué clientes cancelarán su suscripción el próximo mes. Tienen un dataset con 500.000 clientes donde solo el 3% canceló históricamente. Un analista de negocio (sin experiencia en Python) va a construir el modelo. ¿Qué herramienta y métrica son más adecuadas?

Inicia sesión para llevar tu progreso.

AnteriorAzure Machine LearningMachine Learning en Azure SiguienteConceptos de visión por computadoraVisión por computadora