AI-901

Deep Dive

Practicar ahora
D5 · IA Generativa

Azure OpenAI Service — Modelos, Deployments y Content Filtering

Azure OpenAI Service da acceso empresarial a los modelos de OpenAI (GPT-4, DALL-E, Whisper) con la infraestructura, seguridad y compliance de Azure. El AI-901 evalúa qué modelos usar en qué escenario y cómo funciona el content filtering.

¿Qué es Azure OpenAI Service?

Azure OpenAI Service es el servicio de Azure que proporciona acceso a los modelos de OpenAI (GPT-4, GPT-3.5, DALL-E, Whisper, embeddings) con las garantías de la plataforma Azure: cumplimiento normativo, RBAC, red privada, SLA empresarial y los datos del cliente no se usan para entrenar los modelos.

🏢

Acceso enterprise

Los modelos se despliegan en tu propia región de Azure. Los datos no se comparten con OpenAI ni se usan para mejorar el modelo base.

🔌

Misma API

Compatible con la API de OpenAI. Puedes migrar aplicaciones existentes cambiando solo el endpoint y la clave.

Compliance

SOC 2, ISO 27001, HIPAA, GDPR. Redes privadas con VNet. Integra con Azure AD/Entra ID para RBAC.

Modelos disponibles

GPT-4o / GPT-4

Chat & Completions

Multimodal

Razonamiento complejo, análisis de imágenes, código avanzado, generación larga.

GPT-3.5-turbo

Chat & Completions

Chatbots, resúmenes, clasificación, extracción. Económico para alto volumen.

text-embedding-ada-002 / text-embedding-3

Embeddings

Convertir texto en vectores para RAG, búsqueda semántica, clustering.

DALL-E 3

Image Generation

Generar imágenes a partir de texto. Marketing, diseño, prototipos visuales.

Whisper

Speech-to-Text

Transcripción de audio. 99+ idiomas. Disponible vía Azure OpenAI.

Embeddings — qué son y para qué sirven

Los embeddings convierten texto en vectores numéricos que capturan el significado semántico. Textos similares tienen vectores similares. Se usan para: RAG (encontrar documentos relevantes), búsqueda semántica (buscar por significado, no por palabras exactas), y clustering (agrupar documentos por tema). Modelo a usar en Azure: text-embedding-3-small o text-embedding-3-large.

Deployments y endpoints

En Azure OpenAI, primero creas un deployment (instancia del modelo) con un nombre personalizado. Las llamadas a la API usan ese nombre de deployment, no el nombre del modelo base. Esto permite versionar y controlar el modelo exacto en uso.

Flujo de configuración

1

Crear recurso Azure OpenAI

En Azure Portal o CLI. Elegir región (disponibilidad de modelos varía por región).

2

Crear deployment

Seleccionar modelo base (ej: gpt-4o), darle un nombre personalizado (ej: "mi-gpt4-prod"), configurar quota de tokens por minuto.

3

Obtener endpoint y API key

URL del endpoint: https://{recurso}.openai.azure.com/. API key desde Azure Portal o usar Managed Identity.

4

Llamar a la API

REST API o SDK (Python, C#, JavaScript). Parámetro "deployment_name" en vez de "model" de la API de OpenAI.com.

Tipos de deployment

Standard: Cuota compartida. Pay-as-you-go. Ideal para desarrollo y cargas moderadas.
Provisioned (PTU): Capacidad dedicada. Latencia predecible. Para producción de alto volumen.
Batch: Procesamiento asíncrono de grandes volúmenes con descuento de precio.

Trampa de examen: nombre de deployment

En Azure OpenAI, la API recibe el nombre del deployment (que eliges tú), no el nombre del modelo. Dos deployments pueden usar el mismo modelo base con distintos nombres. Esto se pregunta en el examen.

Playground y Azure AI Studio

Azure OpenAI Playground

Interfaz web para probar modelos interactivamente sin escribir código. Permite experimentar con system prompts, parámetros y ver el código generado.

Chat Playground — conversación interactiva
Completions — texto libre (modelos legacy)
DALL-E — generación de imágenes
Ver el código Python/REST equivalente
Ajustar temperatura, max tokens, top-p en tiempo real

Azure AI Studio (AI Foundry)

Portal unificado para construir y desplegar aplicaciones de IA generativa. Va más allá del playground: incluye pipelines, evaluación, RAG y model catalog.

Model Catalog — 1.000+ modelos (Azure OpenAI + terceros)
Prompt Flow — pipelines visuales con LLMs
Evaluación automática de respuestas
Azure AI Search integrado para RAG
Despliegue a endpoints REST con un clic

Examen: Azure OpenAI Playground vs AI Studio

Playground = probar modelos rápidamente. AI Studio = construir y desplegar aplicaciones completas de GenAI.

Content Filtering

Azure OpenAI incluye un sistema de filtrado de contenido que se aplica tanto a los prompts (input) como a las respuestas (output). Clasifica contenido en categorías de daño y puede bloquear o registrar según el nivel configurado.

Hate

Off / Low / Medium / High

Discurso de odio, discriminación por raza, género, religión, origen.

Sexual

Off / Low / Medium / High

Contenido sexual explícito o sugerente.

Violence

Off / Low / Medium / High

Contenido violento, instrucciones de daño físico.

Self-harm

Off / Low / Medium / High

Contenido que promueve autolesiones o suicidio.

Jailbreak

On / Off

Intentos de hacer que el modelo ignore sus instrucciones de sistema.

Protected material

On / Off

Texto o código con derechos de autor protegidos.

Cómo funciona

1. El usuario envía un prompt → el filtro analiza el input.

2. Si el input supera el umbral configurado → la llamada se bloquea (error 400).

3. El modelo genera respuesta → el filtro analiza el output.

4. Si el output supera el umbral → se devuelve respuesta vacía o un mensaje de error.

5. Todos los eventos de filtrado se registran para auditoría.

Trampa de examen

El content filtering aplica a AMBOS sentidos: input (prompt del usuario) y output (respuesta del modelo). No es solo filtrar lo que dice el modelo — también filtra lo que le preguntan.

El nivel "Off" solo está disponible para clientes aprobados con casos de uso especiales (ej: investigación de seguridad). Por defecto, todos los niveles tienen filtrado activo.

Azure OpenAI vs OpenAI.com

DimensiónAzure OpenAIOpenAI.com
Datos de usuarioNo se usan para entrenar modelosPueden usarse salvo opt-out
Cumplimiento (compliance)HIPAA, SOC 2, ISO 27001, GDPRMás limitado
Red privadaVNet, Private EndpointSolo internet público
AutenticaciónAzure AD / Managed Identity + API keySolo API key
SLA99.9% (Microsoft SLA)Sin SLA formal
Modelos disponiblesSubconjunto de modelos OpenAITodos los modelos OpenAI
Velocidad de actualizaciónMás lenta (requiere validación de Azure)Más rápida (primero en lanzar)
PrecioSimilar, con opción PTU para volumenPay-as-you-go estándar

Regla de oro: Azure OpenAI para empresas con requisitos de compliance, datos sensibles (salud, finanzas, legal) o que necesitan integración con su infraestructura Azure existente.

Casos de uso por modelo

EscenarioModeloPor qué
Chatbot de atención al cliente 24/7GPT-3.5-turboEconómico para alto volumen, suficiente para conversación general
Análisis de contratos legales complejosGPT-4oRazonamiento avanzado, contexto largo, análisis matizado
Analizar facturas escaneadas como imagenGPT-4o (multimodal)Único modelo que puede "ver" imágenes en Azure OpenAI
Búsqueda semántica en base de documentostext-embedding-3Convierte texto a vectores para RAG y búsqueda semántica
Generar ilustraciones para e-commerceDALL-E 3Modelo de generación de imágenes desde texto
Transcribir reuniones grabadasWhisperSTT de alta precisión, 99+ idiomas, disponible en Azure OpenAI
Asistente de código en IDEGPT-4o / GPT-3.5GPT-4o para código complejo; GPT-3.5 para autocompletado económico

Microsoft Copilot

Microsoft Copilot es la capa de experiencia de usuario con IA generativa integrada en los productos de Microsoft. Usa Azure OpenAI bajo el capó.

Microsoft 365 Copilot

Microsoft 365

En Word, Excel, PowerPoint, Teams, Outlook. Resume reuniones, genera documentos, analiza datos de Excel.

GitHub Copilot

GitHub

Asistente de código en VS Code y otros IDEs. Autocompletado, generación de tests, explicación de código.

Copilot in Windows

Windows

Asistente en el sistema operativo. Disponible en barra lateral. Usa Bing + GPT-4.

Copilot Studio

Enterprise

Plataforma no-code/low-code para construir copilots personalizados para empresas. Antes Power Virtual Agents.

Copilot in Azure

Azure

Asistente en Azure Portal para IaC, diagnóstico de problemas, consultas de recursos.

Security Copilot

Security

Análisis de amenazas, respuesta a incidentes, generación de reportes de seguridad con lenguaje natural.

Trampa de examen: Copilot vs Azure OpenAI

Microsoft Copilot = producto/experiencia lista para usar (en M365, Windows, GitHub).
Azure OpenAI Service = infraestructura para construir tus propias aplicaciones con modelos de OpenAI.
Copilot Studio = herramienta para construir copilots personalizados sin ser desarrollador.

Trampas frecuentes del examen

¿Azure OpenAI usa tus datos para entrenar sus modelos?

No. A diferencia de OpenAI.com (salvo opt-out), Azure OpenAI garantiza que los datos del cliente NO se usan para mejorar los modelos. Es una de las diferencias clave frente a la API directa de OpenAI.

¿El content filtering se aplica solo a las respuestas del modelo?

No. Se aplica tanto al INPUT (prompt del usuario) como al OUTPUT (respuesta del modelo). Si el prompt del usuario contiene contenido dañino, la llamada se bloquea antes de llegar al modelo.

¿DALL-E genera y también analiza imágenes?

No. DALL-E solo GENERA imágenes a partir de texto. Para ANALIZAR imágenes (describir qué hay en una foto, extraer texto de imagen) se usa GPT-4o (multimodal) o Azure AI Vision. Son capacidades distintas.

¿Copilot Studio y Azure OpenAI son lo mismo?

No. Copilot Studio es una plataforma low-code para construir bots/copilots personalizados (antes Power Virtual Agents). Azure OpenAI Service es la API para desarrolladores para construir aplicaciones con los modelos de OpenAI. Ambos pueden integrarse, pero son productos diferentes.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Un hospital quiere usar IA generativa para ayudar a los médicos a redactar informes clínicos. Los datos son altamente confidenciales (historias médicas de pacientes). Necesitan garantías de que los datos NO se usarán para entrenar modelos externos y deben cumplir con HIPAA. ¿Qué servicio deben usar?