AI-901

Deep Dive

D5 · IA Generativa

Azure AI Foundry y catálogo de modelos

Azure AI Foundry es la plataforma central de Microsoft para construir soluciones de IA generativa. Unifica acceso a modelos, herramientas de evaluación, despliegues y monitoreo en un solo portal. El AI-901 evalúa sus capacidades y las del catálogo de modelos integrado.

Contenido

¿Qué es Azure AI Foundry?
Hubs, proyectos y conexiones
Azure AI Foundry portal
Catálogo de modelos
Modelos Phi — SLMs de Microsoft
Desplegar desde el catálogo
AI Foundry vs Azure OpenAI Service

¿Qué es Azure AI Foundry?

Azure AI Foundry (anteriormente Azure AI Studio) es la plataforma unificada de Microsoft para diseñar, construir, evaluar y desplegar aplicaciones de IA generativa de nivel empresarial. Accesible en ai.azure.com.

Catálogo de modelos

Acceso a cientos de modelos de Microsoft, OpenAI, Meta, Mistral, Cohere y más — todos en un solo lugar.

Playgrounds integrados

Experimenta con modelos sin escribir código. Compara respuestas, ajusta parámetros, prueba system prompts.

Despliegues gestionados

Publica modelos como endpoints REST seguros con escalado automático, sin administrar infraestructura.

Evaluación y métricas

Mide calidad, coherencia, groundedness y seguridad de las respuestas de tu modelo antes de producción.

Azure AI Search integrado

Conecta bases de conocimiento para implementar RAG (Retrieval-Augmented Generation) directamente desde el portal.

Content safety

Filtros de contenido configurables (odio, violencia, sexual, autolesión) aplicados a inputs y outputs del modelo.

Hubs, proyectos y conexiones

Azure AI Foundry organiza los recursos en una jerarquía de dos niveles.

Hub

Contenedor organizativo de nivel superior. Define la suscripción de Azure, la región y las conexiones compartidas (Azure OpenAI, Azure AI Search, Storage). Un hub puede agrupar múltiples proyectos del equipo.

Configuración de red y seguridad centralizada
Conexiones a servicios Azure compartidas entre proyectos
Políticas de acceso y gestión de identidades
Cuotas y límites de compute

Proyecto

Workspace de trabajo para un caso de uso específico. Contiene los assets del proyecto: despliegues de modelos, índices de búsqueda, datasets, evaluaciones y flujos de trabajo.

Despliegues de modelos propios del proyecto
Historial de experimentos y evaluaciones
Flujos de trabajo (prompt flows)
Archivos y datasets del proyecto

Clave del examen

Hub = organización / seguridad. Proyecto = espacio de trabajo del equipo de desarrollo. Las conexiones configuradas en el Hub están disponibles para todos los proyectos que contiene.

Azure AI Foundry portal — secciones clave

Playground

Interfaz de chat y completación para explorar modelos sin código. Permite cambiar entre modelos, ajustar temperature/top_p, configurar system prompts y comparar respuestas en paralelo.

Model catalog

Biblioteca de modelos disponibles para desplegar. Filtra por tarea, proveedor, benchmark o licencia. Incluye fichas de modelo con parámetros, capacidades y precios.

Deployments

Gestión de modelos desplegados como endpoints REST. Muestra el nombre del deployment, versión del modelo, tipo (Standard / PTU / Batch) y estado.

Evaluation

Herramientas para medir calidad de respuestas. Evalúa coherencia, relevancia, groundedness (respaldado por fuentes) y seguridad de contenido con métricas automatizadas.

Prompt flow

Editor visual de flujos de orquestación de IA. Encadena llamadas a LLMs, búsquedas vectoriales, procesamiento Python y herramientas externas en pipelines visuales.

Content filters

Configuración de filtros de seguridad por severidad para cada categoría de daño (odio, violencia, sexual, autolesión) aplicados a prompts y completaciones.

Catálogo de modelos — model catalog

El catálogo de modelos de Azure AI Foundry agrupa cientos de modelos de múltiples proveedores. Permite comparar, evaluar y desplegar modelos desde una interfaz unificada — sin gestionar infraestructura propia.

Microsoft

Phi-4, Phi-3.5, Phi-3 (mini, small, medium)

Small Language Models (SLMs) altamente eficientes. Rendimiento comparable a modelos más grandes en tareas de razonamiento, con menor costo y latencia.

OpenAI

GPT-4o, GPT-4o mini, GPT-4 Turbo, GPT-3.5 Turbo, DALL-E 3, Whisper, text-embedding-3

Modelos de OpenAI disponibles a través de Azure con cumplimiento empresarial, SLAs y privacidad de datos garantizada.

Modelos Phi de Microsoft — SLMs

La familia Phi son los Small Language Models (SLMs) de Microsoft — modelos pequeños optimizados para razonamiento de alta calidad con pocos parámetros. Su punto diferencial: costo bajo, latencia mínima, pueden correr en dispositivos edge.

Modelo	Parámetros	Mejor para
Phi-4	14B	Razonamiento matemático avanzado, seguimiento de instrucciones, tareas complejas
Phi-3.5 MoE	41B (activos: 6.6B)	Mixture-of-Experts: calidad GPT-4 con activación parcial de parámetros
Phi-3 Medium	14B	Balance rendimiento / costo para despliegue cloud
Phi-3 Small	7B	Tareas de razonamiento con restricción de recursos
Phi-3 Mini	3.8B	Edge devices, móviles, inferencia local sin GPU dedicada

SLM vs LLM

LLM (Large Language Model) = GPT-4, Llama 70B — máxima capacidad, alto costo. SLM (Small Language Model) = Phi-3 Mini — eficiente, económico, desplegable en edge. El catálogo de Foundry ofrece ambos para elegir según el caso de uso.

Desplegar un modelo desde el catálogo

1. Explorar el catálogo

En Azure AI Foundry portal → Model catalog. Filtrar por tarea, proveedor o benchmark. Seleccionar el modelo adecuado.

2. Revisar la ficha del modelo

Ver descripción, casos de uso, límites de contexto, idiomas soportados, licencia y opciones de despliegue disponibles.

3. Elegir tipo de despliegue

Standard (pay-per-token), PTU (Provisioned Throughput Units — capacidad reservada), Serverless API (facturado por uso, sin infraestructura dedicada).

4. Crear el deployment

Asignar nombre al deployment, seleccionar versión del modelo, configurar límites de rate (tokens por minuto). Se genera un endpoint REST con clave API.

5. Probar en Playground

Verificar el deployment en el playground integrado antes de conectar a la aplicación. Ajustar system prompt y parámetros de generación.

6. Integrar en la aplicación

Usar el endpoint generado con el SDK de Azure AI Foundry, Azure OpenAI SDK o llamadas REST directas con la API key del deployment.

Azure AI Foundry vs Azure OpenAI Service

Azure AI Foundry incluye Azure OpenAI Service — no son servicios separados que compiten. Foundry es la plataforma completa; Azure OpenAI es el servicio específico para los modelos de OpenAI.

Aspecto	Azure AI Foundry	Azure OpenAI Service
Alcance	Plataforma unificada completa para GenAI	Servicio específico para modelos OpenAI (GPT, DALL-E, Whisper)
Modelos	Todos: Microsoft, OpenAI, Meta, Mistral, Cohere…	Solo modelos de OpenAI
Portal	ai.azure.com — interfaz unificada	Accesible desde dentro de AI Foundry o directamente
Herramientas	Playground, prompt flow, evaluación, fine-tuning, RAG	Playground, fine-tuning, deployments de modelos OpenAI
Público objetivo	Equipos de desarrollo de apps GenAI completas	Integraciones directas a modelos GPT/DALL-E/Whisper
Organización	Hubs + proyectos	Recursos de Azure OpenAI

Trampa de examen

"Azure AI Foundry contiene Azure OpenAI Service" — no son alternativas. Si el escenario necesita modelos de múltiples proveedores, herramientas de evaluación o RAG integrado → Azure AI Foundry. Si solo necesita GPT-4 o DALL-E → Azure OpenAI Service directamente (o desde Foundry).

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa quiere construir un asistente de soporte técnico usando IA generativa. El equipo necesita: comparar modelos de Microsoft y Meta para elegir el mejor, implementar RAG con su base de conocimientos, y evaluar la calidad de respuestas antes de producción. ¿Qué plataforma Azure cubre todos estos requisitos?

Inicia sesión para llevar tu progreso.

AnteriorAzure OpenAI Service — modelos y desplieguesIA Generativa SiguientePrompt Engineering — técnicas y parámetrosIA Generativa