AI-901

Deep Dive

Practicar ahora
D5 · IA Generativa

Azure AI Foundry y catálogo de modelos

Azure AI Foundry es la plataforma central de Microsoft para construir soluciones de IA generativa. Unifica acceso a modelos, herramientas de evaluación, despliegues y monitoreo en un solo portal. El AI-901 evalúa sus capacidades y las del catálogo de modelos integrado.

¿Qué es Azure AI Foundry?

Azure AI Foundry (anteriormente Azure AI Studio) es la plataforma unificada de Microsoft para diseñar, construir, evaluar y desplegar aplicaciones de IA generativa de nivel empresarial. Accesible en ai.azure.com.

Catálogo de modelos

Acceso a cientos de modelos de Microsoft, OpenAI, Meta, Mistral, Cohere y más — todos en un solo lugar.

Playgrounds integrados

Experimenta con modelos sin escribir código. Compara respuestas, ajusta parámetros, prueba system prompts.

Despliegues gestionados

Publica modelos como endpoints REST seguros con escalado automático, sin administrar infraestructura.

Evaluación y métricas

Mide calidad, coherencia, groundedness y seguridad de las respuestas de tu modelo antes de producción.

Azure AI Search integrado

Conecta bases de conocimiento para implementar RAG (Retrieval-Augmented Generation) directamente desde el portal.

Content safety

Filtros de contenido configurables (odio, violencia, sexual, autolesión) aplicados a inputs y outputs del modelo.

Hubs, proyectos y conexiones

Azure AI Foundry organiza los recursos en una jerarquía de dos niveles.

Hub

Contenedor organizativo de nivel superior. Define la suscripción de Azure, la región y las conexiones compartidas (Azure OpenAI, Azure AI Search, Storage). Un hub puede agrupar múltiples proyectos del equipo.

  • Configuración de red y seguridad centralizada
  • Conexiones a servicios Azure compartidas entre proyectos
  • Políticas de acceso y gestión de identidades
  • Cuotas y límites de compute

Proyecto

Workspace de trabajo para un caso de uso específico. Contiene los assets del proyecto: despliegues de modelos, índices de búsqueda, datasets, evaluaciones y flujos de trabajo.

  • Despliegues de modelos propios del proyecto
  • Historial de experimentos y evaluaciones
  • Flujos de trabajo (prompt flows)
  • Archivos y datasets del proyecto

Clave del examen

Hub = organización / seguridad. Proyecto = espacio de trabajo del equipo de desarrollo. Las conexiones configuradas en el Hub están disponibles para todos los proyectos que contiene.

Azure AI Foundry portal — secciones clave

Playground

Interfaz de chat y completación para explorar modelos sin código. Permite cambiar entre modelos, ajustar temperature/top_p, configurar system prompts y comparar respuestas en paralelo.

Model catalog

Biblioteca de modelos disponibles para desplegar. Filtra por tarea, proveedor, benchmark o licencia. Incluye fichas de modelo con parámetros, capacidades y precios.

Deployments

Gestión de modelos desplegados como endpoints REST. Muestra el nombre del deployment, versión del modelo, tipo (Standard / PTU / Batch) y estado.

Evaluation

Herramientas para medir calidad de respuestas. Evalúa coherencia, relevancia, groundedness (respaldado por fuentes) y seguridad de contenido con métricas automatizadas.

Prompt flow

Editor visual de flujos de orquestación de IA. Encadena llamadas a LLMs, búsquedas vectoriales, procesamiento Python y herramientas externas en pipelines visuales.

Content filters

Configuración de filtros de seguridad por severidad para cada categoría de daño (odio, violencia, sexual, autolesión) aplicados a prompts y completaciones.

Catálogo de modelos — model catalog

El catálogo de modelos de Azure AI Foundry agrupa cientos de modelos de múltiples proveedores. Permite comparar, evaluar y desplegar modelos desde una interfaz unificada — sin gestionar infraestructura propia.

Microsoft

Phi-4, Phi-3.5, Phi-3 (mini, small, medium)

Small Language Models (SLMs) altamente eficientes. Rendimiento comparable a modelos más grandes en tareas de razonamiento, con menor costo y latencia.

OpenAI

GPT-4o, GPT-4o mini, GPT-4 Turbo, GPT-3.5 Turbo, DALL-E 3, Whisper, text-embedding-3

Modelos de OpenAI disponibles a través de Azure con cumplimiento empresarial, SLAs y privacidad de datos garantizada.

Meta

Llama 3.1, Llama 3, Llama 2 (7B, 13B, 70B)

Modelos open-source de Meta. Disponibles con licencia permisiva para uso comercial. Despliegue gestionado en Azure sin administrar servidores.

Mistral AI

Mistral Large, Mistral Small, Mixtral 8x7B, Codestral

Modelos europeos de alto rendimiento. Mistral Large compite con GPT-4 en benchmarks de razonamiento y código.

Cohere

Command R+, Command R, Embed (multilingüe)

Especializados en RAG y búsqueda empresarial. Embed de Cohere es uno de los mejores modelos de embeddings multilingüe para búsqueda vectorial.

Filtros del catálogo — cómo elegir un modelo

Por tarea

text generation, embeddings, image generation, speech-to-text, translation

Por proveedor

Microsoft, OpenAI, Meta, Mistral, Cohere, Hugging Face

Por licencia

MIT, Apache 2.0, comercial, uso no comercial

Por benchmark

MMLU, HumanEval, MT-Bench — comparación objetiva de rendimiento

Icon-166Artboard 1

Modelos Phi de Microsoft — SLMs

La familia Phi son los Small Language Models (SLMs) de Microsoft — modelos pequeños optimizados para razonamiento de alta calidad con pocos parámetros. Su punto diferencial: costo bajo, latencia mínima, pueden correr en dispositivos edge.

ModeloParámetrosMejor para
Phi-414BRazonamiento matemático avanzado, seguimiento de instrucciones, tareas complejas
Phi-3.5 MoE41B (activos: 6.6B)Mixture-of-Experts: calidad GPT-4 con activación parcial de parámetros
Phi-3 Medium14BBalance rendimiento / costo para despliegue cloud
Phi-3 Small7BTareas de razonamiento con restricción de recursos
Phi-3 Mini3.8BEdge devices, móviles, inferencia local sin GPU dedicada

SLM vs LLM

LLM (Large Language Model) = GPT-4, Llama 70B — máxima capacidad, alto costo. SLM (Small Language Model) = Phi-3 Mini — eficiente, económico, desplegable en edge. El catálogo de Foundry ofrece ambos para elegir según el caso de uso.

Desplegar un modelo desde el catálogo

1

1. Explorar el catálogo

En Azure AI Foundry portal → Model catalog. Filtrar por tarea, proveedor o benchmark. Seleccionar el modelo adecuado.

2

2. Revisar la ficha del modelo

Ver descripción, casos de uso, límites de contexto, idiomas soportados, licencia y opciones de despliegue disponibles.

3

3. Elegir tipo de despliegue

Standard (pay-per-token), PTU (Provisioned Throughput Units — capacidad reservada), Serverless API (facturado por uso, sin infraestructura dedicada).

4

4. Crear el deployment

Asignar nombre al deployment, seleccionar versión del modelo, configurar límites de rate (tokens por minuto). Se genera un endpoint REST con clave API.

5

5. Probar en Playground

Verificar el deployment en el playground integrado antes de conectar a la aplicación. Ajustar system prompt y parámetros de generación.

6

6. Integrar en la aplicación

Usar el endpoint generado con el SDK de Azure AI Foundry, Azure OpenAI SDK o llamadas REST directas con la API key del deployment.

Azure AI Foundry vs Azure OpenAI Service

Azure AI Foundry incluye Azure OpenAI Service — no son servicios separados que compiten. Foundry es la plataforma completa; Azure OpenAI es el servicio específico para los modelos de OpenAI.

AspectoAzure AI FoundryAzure OpenAI Service
AlcancePlataforma unificada completa para GenAIServicio específico para modelos OpenAI (GPT, DALL-E, Whisper)
ModelosTodos: Microsoft, OpenAI, Meta, Mistral, Cohere…Solo modelos de OpenAI
Portalai.azure.com — interfaz unificadaAccesible desde dentro de AI Foundry o directamente
HerramientasPlayground, prompt flow, evaluación, fine-tuning, RAGPlayground, fine-tuning, deployments de modelos OpenAI
Público objetivoEquipos de desarrollo de apps GenAI completasIntegraciones directas a modelos GPT/DALL-E/Whisper
OrganizaciónHubs + proyectosRecursos de Azure OpenAI

Trampa de examen

"Azure AI Foundry contiene Azure OpenAI Service" — no son alternativas. Si el escenario necesita modelos de múltiples proveedores, herramientas de evaluación o RAG integrado → Azure AI Foundry. Si solo necesita GPT-4 o DALL-E → Azure OpenAI Service directamente (o desde Foundry).

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa quiere construir un asistente de soporte técnico usando IA generativa. El equipo necesita: comparar modelos de Microsoft y Meta para elegir el mejor, implementar RAG con su base de conocimientos, y evaluar la calidad de respuestas antes de producción. ¿Qué plataforma Azure cubre todos estos requisitos?