AI-901
Deep Dive
Azure ML ofrece dos herramientas para usuarios sin experiencia profunda en ML: AutoML automatiza la selección de algoritmos y Designer proporciona un canvas visual de arrastrar y soltar. El AI-901 evalúa cuándo y cómo usar cada una.
Contenido
AutoML (Automated Machine Learning) automatiza las partes más técnicas del proceso de ML: probar múltiples algoritmos, ajustar hiperparámetros y seleccionar el mejor modelo — todo sin que el usuario escriba código de ML.
Qué automatiza AutoML
Qué NO automatiza AutoML
Trampa crítica del examen
AutoML no reemplaza a los data scientists. Democratiza el ML para usuarios de negocio y acelera la experimentación, pero los profesionales siguen siendo necesarios para definir el problema, preparar datos de calidad, interpretar resultados y supervisar modelos en producción.
Preparar dataset
Subir datos a Azure ML como dataset tabular o de series temporales. AutoML requiere datos estructurados (tablas).
Configurar experimento
Seleccionar: tipo de tarea (clasificación/regresión/forecasting), columna objetivo (label), métrica de optimización, tiempo máximo de entrenamiento.
Seleccionar compute
Elegir Compute Cluster para el entrenamiento paralelo. AutoML entrena múltiples modelos en paralelo si el cluster tiene varios nodos.
Ejecución automática
AutoML prueba combinaciones de algoritmos + hiperparámetros. Cada combinación es un "child run" dentro del experimento padre.
Revisar resultados
La UI muestra un ranking de modelos con métricas. Se puede explorar explicabilidad (feature importance) de cada modelo.
Desplegar el mejor modelo
Un clic para registrar el modelo en el Model Registry y desplegarlo como endpoint de inferencia online o batch.
Clasificación
Predice a qué categoría pertenece una observación.
Ejemplos
Métricas
Accuracy, AUC, F1, Precision, Recall
Regresión
Predice un valor numérico continuo.
Ejemplos
Métricas
RMSE, MAE, R², MAPE
Forecasting (series temporales)
Predice valores futuros basándose en patrones históricos con índice temporal.
Ejemplos
Métricas
MAPE, RMSE, MAE con horizonte temporal
Computer Vision y NLP con AutoML
AutoML también soporta tareas de imagen (clasificación de imágenes, detección de objetos) y texto (clasificación de texto, NER) entrenando modelos de deep learning. Para el AI-901, el énfasis está en las tareas tabulares clásicas.
AutoML clasifica los modelos candidatos por la métrica de optimización elegida. Debes elegir la métrica correcta según el problema.
| Escenario | Métrica recomendada | Por qué |
|---|---|---|
| Detección de fraude (clases desbalanceadas) | AUC_weighted | Robusto con clases desiguales; accuracy engañaría |
| Clasificación con clases balanceadas | Accuracy | Métrica más intuitiva cuando las clases son iguales |
| Diagnóstico médico (minimizar falsos negativos) | Recall / F1 | Más importante no perder positivos (enfermos) |
| Moderación de spam (minimizar falsos positivos) | Precision | Más importante no bloquear emails legítimos |
| Predicción de precio | RMSE o R² | RMSE penaliza errores grandes; R² mide varianza explicada |
| Predicción de demanda (errores relativos) | MAPE | Error porcentual independiente de la escala |
Designer es el canvas visual de arrastrar y soltar de Azure ML. Permite construir pipelines de ML conectando módulos gráficamente, sin código. Ideal para personas que entienden el proceso de ML pero no quieren (o no pueden) programar.
Entienden el negocio pero no Python/R.
Familiares con datos pero no con código de ML.
Visualizar el pipeline ayuda a entender el proceso.
Probar ideas de pipeline antes de codificar.
Entrada de datos
Transformación de datos
Algoritmos de ML
Entrenamiento y evaluación
Despliegue
| Dimensión | AutoML | Designer | SDK / Notebooks |
|---|---|---|---|
| Código requerido | No (UI) o mínimo | No | Sí (Python/R) |
| Control del algoritmo | Automático | Selección visual | Total |
| Perfil ideal | Analistas, exploración rápida | No-code, visualización | Data scientists |
| Flexibilidad | Media | Media | Máxima |
| Producción a escala | Bueno | Limitado | Óptimo |
| Reproducibilidad | Alta | Media | Máxima (git) |
❓ ¿AutoML elige automáticamente la métrica de optimización correcta?
No. El usuario debe elegir la métrica objetivo según el problema de negocio. AutoML maximiza la métrica que le indiques, pero elegir la métrica incorrecta (ej: accuracy para clases desbalanceadas) producirá un modelo que no sirve aunque la métrica sea alta.
❓ ¿AutoML elimina la necesidad de data scientists?
No. AutoML automatiza la selección de algoritmos e hiperparámetros, pero los data scientists siguen siendo necesarios para definir el problema, preparar datos, interpretar resultados y gestionar modelos en producción. AutoML democratiza el ML, no lo reemplaza.
❓ ¿Designer y AutoML son lo mismo?
No. Designer es un canvas visual donde tú construyes el pipeline paso a paso conectando módulos. AutoML decide automáticamente qué algoritmos probar y cómo configurarlos. Designer da control visual; AutoML da automatización completa.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa de telecomunicaciones quiere predecir qué clientes cancelarán su suscripción el próximo mes. Tienen un dataset con 500.000 clientes donde solo el 3% canceló históricamente. Un analista de negocio (sin experiencia en Python) va a construir el modelo. ¿Qué herramienta y métrica son más adecuadas?