AI-901
Deep Dive
Azure AI Foundry es la plataforma central de Microsoft para construir soluciones de IA generativa. Unifica acceso a modelos, herramientas de evaluación, despliegues y monitoreo en un solo portal. El AI-901 evalúa sus capacidades y las del catálogo de modelos integrado.
Contenido
Azure AI Foundry (anteriormente Azure AI Studio) es la plataforma unificada de Microsoft para diseñar, construir, evaluar y desplegar aplicaciones de IA generativa de nivel empresarial. Accesible en ai.azure.com.
Catálogo de modelos
Acceso a cientos de modelos de Microsoft, OpenAI, Meta, Mistral, Cohere y más — todos en un solo lugar.
Playgrounds integrados
Experimenta con modelos sin escribir código. Compara respuestas, ajusta parámetros, prueba system prompts.
Despliegues gestionados
Publica modelos como endpoints REST seguros con escalado automático, sin administrar infraestructura.
Evaluación y métricas
Mide calidad, coherencia, groundedness y seguridad de las respuestas de tu modelo antes de producción.
Azure AI Search integrado
Conecta bases de conocimiento para implementar RAG (Retrieval-Augmented Generation) directamente desde el portal.
Content safety
Filtros de contenido configurables (odio, violencia, sexual, autolesión) aplicados a inputs y outputs del modelo.
Azure AI Foundry organiza los recursos en una jerarquía de dos niveles.
Hub
Contenedor organizativo de nivel superior. Define la suscripción de Azure, la región y las conexiones compartidas (Azure OpenAI, Azure AI Search, Storage). Un hub puede agrupar múltiples proyectos del equipo.
Proyecto
Workspace de trabajo para un caso de uso específico. Contiene los assets del proyecto: despliegues de modelos, índices de búsqueda, datasets, evaluaciones y flujos de trabajo.
Clave del examen
Hub = organización / seguridad. Proyecto = espacio de trabajo del equipo de desarrollo. Las conexiones configuradas en el Hub están disponibles para todos los proyectos que contiene.
Interfaz de chat y completación para explorar modelos sin código. Permite cambiar entre modelos, ajustar temperature/top_p, configurar system prompts y comparar respuestas en paralelo.
Biblioteca de modelos disponibles para desplegar. Filtra por tarea, proveedor, benchmark o licencia. Incluye fichas de modelo con parámetros, capacidades y precios.
Gestión de modelos desplegados como endpoints REST. Muestra el nombre del deployment, versión del modelo, tipo (Standard / PTU / Batch) y estado.
Herramientas para medir calidad de respuestas. Evalúa coherencia, relevancia, groundedness (respaldado por fuentes) y seguridad de contenido con métricas automatizadas.
Editor visual de flujos de orquestación de IA. Encadena llamadas a LLMs, búsquedas vectoriales, procesamiento Python y herramientas externas en pipelines visuales.
Configuración de filtros de seguridad por severidad para cada categoría de daño (odio, violencia, sexual, autolesión) aplicados a prompts y completaciones.
El catálogo de modelos de Azure AI Foundry agrupa cientos de modelos de múltiples proveedores. Permite comparar, evaluar y desplegar modelos desde una interfaz unificada — sin gestionar infraestructura propia.
Microsoft
Phi-4, Phi-3.5, Phi-3 (mini, small, medium)
Small Language Models (SLMs) altamente eficientes. Rendimiento comparable a modelos más grandes en tareas de razonamiento, con menor costo y latencia.
OpenAI
GPT-4o, GPT-4o mini, GPT-4 Turbo, GPT-3.5 Turbo, DALL-E 3, Whisper, text-embedding-3
Modelos de OpenAI disponibles a través de Azure con cumplimiento empresarial, SLAs y privacidad de datos garantizada.
Meta
Llama 3.1, Llama 3, Llama 2 (7B, 13B, 70B)
Modelos open-source de Meta. Disponibles con licencia permisiva para uso comercial. Despliegue gestionado en Azure sin administrar servidores.
Mistral AI
Mistral Large, Mistral Small, Mixtral 8x7B, Codestral
Modelos europeos de alto rendimiento. Mistral Large compite con GPT-4 en benchmarks de razonamiento y código.
Cohere
Command R+, Command R, Embed (multilingüe)
Especializados en RAG y búsqueda empresarial. Embed de Cohere es uno de los mejores modelos de embeddings multilingüe para búsqueda vectorial.
Filtros del catálogo — cómo elegir un modelo
Por tarea
text generation, embeddings, image generation, speech-to-text, translation
Por proveedor
Microsoft, OpenAI, Meta, Mistral, Cohere, Hugging Face
Por licencia
MIT, Apache 2.0, comercial, uso no comercial
Por benchmark
MMLU, HumanEval, MT-Bench — comparación objetiva de rendimiento
La familia Phi son los Small Language Models (SLMs) de Microsoft — modelos pequeños optimizados para razonamiento de alta calidad con pocos parámetros. Su punto diferencial: costo bajo, latencia mínima, pueden correr en dispositivos edge.
| Modelo | Parámetros | Mejor para |
|---|---|---|
| Phi-4 | 14B | Razonamiento matemático avanzado, seguimiento de instrucciones, tareas complejas |
| Phi-3.5 MoE | 41B (activos: 6.6B) | Mixture-of-Experts: calidad GPT-4 con activación parcial de parámetros |
| Phi-3 Medium | 14B | Balance rendimiento / costo para despliegue cloud |
| Phi-3 Small | 7B | Tareas de razonamiento con restricción de recursos |
| Phi-3 Mini | 3.8B | Edge devices, móviles, inferencia local sin GPU dedicada |
SLM vs LLM
LLM (Large Language Model) = GPT-4, Llama 70B — máxima capacidad, alto costo. SLM (Small Language Model) = Phi-3 Mini — eficiente, económico, desplegable en edge. El catálogo de Foundry ofrece ambos para elegir según el caso de uso.
1. Explorar el catálogo
En Azure AI Foundry portal → Model catalog. Filtrar por tarea, proveedor o benchmark. Seleccionar el modelo adecuado.
2. Revisar la ficha del modelo
Ver descripción, casos de uso, límites de contexto, idiomas soportados, licencia y opciones de despliegue disponibles.
3. Elegir tipo de despliegue
Standard (pay-per-token), PTU (Provisioned Throughput Units — capacidad reservada), Serverless API (facturado por uso, sin infraestructura dedicada).
4. Crear el deployment
Asignar nombre al deployment, seleccionar versión del modelo, configurar límites de rate (tokens por minuto). Se genera un endpoint REST con clave API.
5. Probar en Playground
Verificar el deployment en el playground integrado antes de conectar a la aplicación. Ajustar system prompt y parámetros de generación.
6. Integrar en la aplicación
Usar el endpoint generado con el SDK de Azure AI Foundry, Azure OpenAI SDK o llamadas REST directas con la API key del deployment.
Azure AI Foundry incluye Azure OpenAI Service — no son servicios separados que compiten. Foundry es la plataforma completa; Azure OpenAI es el servicio específico para los modelos de OpenAI.
| Aspecto | Azure AI Foundry | Azure OpenAI Service |
|---|---|---|
| Alcance | Plataforma unificada completa para GenAI | Servicio específico para modelos OpenAI (GPT, DALL-E, Whisper) |
| Modelos | Todos: Microsoft, OpenAI, Meta, Mistral, Cohere… | Solo modelos de OpenAI |
| Portal | ai.azure.com — interfaz unificada | Accesible desde dentro de AI Foundry o directamente |
| Herramientas | Playground, prompt flow, evaluación, fine-tuning, RAG | Playground, fine-tuning, deployments de modelos OpenAI |
| Público objetivo | Equipos de desarrollo de apps GenAI completas | Integraciones directas a modelos GPT/DALL-E/Whisper |
| Organización | Hubs + proyectos | Recursos de Azure OpenAI |
Trampa de examen
"Azure AI Foundry contiene Azure OpenAI Service" — no son alternativas. Si el escenario necesita modelos de múltiples proveedores, herramientas de evaluación o RAG integrado → Azure AI Foundry. Si solo necesita GPT-4 o DALL-E → Azure OpenAI Service directamente (o desde Foundry).
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa quiere construir un asistente de soporte técnico usando IA generativa. El equipo necesita: comparar modelos de Microsoft y Meta para elegir el mejor, implementar RAG con su base de conocimientos, y evaluar la calidad de respuestas antes de producción. ¿Qué plataforma Azure cubre todos estos requisitos?