AI-901

Deep Dive

D5 · IA Generativa

Azure OpenAI Service — Modelos, Deployments y Content Filtering

Azure OpenAI Service da acceso empresarial a los modelos de OpenAI (GPT-4, DALL-E, Whisper) con la infraestructura, seguridad y compliance de Azure. El AI-901 evalúa qué modelos usar en qué escenario y cómo funciona el content filtering.

Contenido

¿Qué es Azure OpenAI?
Modelos disponibles
Deployments y endpoints
Playground y AI Studio
Content filtering
Azure OpenAI vs OpenAI.com
Casos de uso por modelo
Microsoft Copilot
Trampas frecuentes del examen

¿Qué es Azure OpenAI Service?

Azure OpenAI Service es el servicio de Azure que proporciona acceso a los modelos de OpenAI (GPT-4, GPT-3.5, DALL-E, Whisper, embeddings) con las garantías de la plataforma Azure: cumplimiento normativo, RBAC, red privada, SLA empresarial y los datos del cliente no se usan para entrenar los modelos.

🏢

Acceso enterprise

Los modelos se despliegan en tu propia región de Azure. Los datos no se comparten con OpenAI ni se usan para mejorar el modelo base.

🔌

Misma API

Compatible con la API de OpenAI. Puedes migrar aplicaciones existentes cambiando solo el endpoint y la clave.

✅

Compliance

SOC 2, ISO 27001, HIPAA, GDPR. Redes privadas con VNet. Integra con Azure AD/Entra ID para RBAC.

Modelos disponibles

GPT-4o / GPT-4

Chat & Completions

Multimodal

Razonamiento complejo, análisis de imágenes, código avanzado, generación larga.

GPT-3.5-turbo

Chat & Completions

Chatbots, resúmenes, clasificación, extracción. Económico para alto volumen.

text-embedding-ada-002 / text-embedding-3

Embeddings

Convertir texto en vectores para RAG, búsqueda semántica, clustering.

DALL-E 3

Image Generation

Generar imágenes a partir de texto. Marketing, diseño, prototipos visuales.

Whisper

Speech-to-Text

Transcripción de audio. 99+ idiomas. Disponible vía Azure OpenAI.

Embeddings — qué son y para qué sirven

Los embeddings convierten texto en vectores numéricos que capturan el significado semántico. Textos similares tienen vectores similares. Se usan para: RAG (encontrar documentos relevantes), búsqueda semántica (buscar por significado, no por palabras exactas), y clustering (agrupar documentos por tema). Modelo a usar en Azure: text-embedding-3-small o text-embedding-3-large.

Deployments y endpoints

En Azure OpenAI, primero creas un deployment (instancia del modelo) con un nombre personalizado. Las llamadas a la API usan ese nombre de deployment, no el nombre del modelo base. Esto permite versionar y controlar el modelo exacto en uso.

Flujo de configuración

Crear recurso Azure OpenAI

En Azure Portal o CLI. Elegir región (disponibilidad de modelos varía por región).

Crear deployment

Seleccionar modelo base (ej: gpt-4o), darle un nombre personalizado (ej: "mi-gpt4-prod"), configurar quota de tokens por minuto.

Obtener endpoint y API key

URL del endpoint: https://{recurso}.openai.azure.com/. API key desde Azure Portal o usar Managed Identity.

Llamar a la API

REST API o SDK (Python, C#, JavaScript). Parámetro "deployment_name" en vez de "model" de la API de OpenAI.com.

Tipos de deployment

Standard: Cuota compartida. Pay-as-you-go. Ideal para desarrollo y cargas moderadas.

Provisioned (PTU): Capacidad dedicada. Latencia predecible. Para producción de alto volumen.

Batch: Procesamiento asíncrono de grandes volúmenes con descuento de precio.

Trampa de examen: nombre de deployment

En Azure OpenAI, la API recibe el nombre del deployment (que eliges tú), no el nombre del modelo. Dos deployments pueden usar el mismo modelo base con distintos nombres. Esto se pregunta en el examen.

Playground y Azure AI Studio

Azure OpenAI Playground

Interfaz web para probar modelos interactivamente sin escribir código. Permite experimentar con system prompts, parámetros y ver el código generado.

Chat Playground — conversación interactiva

Completions — texto libre (modelos legacy)

DALL-E — generación de imágenes

Ver el código Python/REST equivalente

Ajustar temperatura, max tokens, top-p en tiempo real

Azure AI Studio (AI Foundry)

Portal unificado para construir y desplegar aplicaciones de IA generativa. Va más allá del playground: incluye pipelines, evaluación, RAG y model catalog.

Model Catalog — 1.000+ modelos (Azure OpenAI + terceros)

Prompt Flow — pipelines visuales con LLMs

Evaluación automática de respuestas

Azure AI Search integrado para RAG

Despliegue a endpoints REST con un clic

Examen: Azure OpenAI Playground vs AI Studio

Playground = probar modelos rápidamente. AI Studio = construir y desplegar aplicaciones completas de GenAI.

Content Filtering

Azure OpenAI incluye un sistema de filtrado de contenido que se aplica tanto a los prompts (input) como a las respuestas (output). Clasifica contenido en categorías de daño y puede bloquear o registrar según el nivel configurado.

Hate

Off / Low / Medium / High

Discurso de odio, discriminación por raza, género, religión, origen.

Sexual

Off / Low / Medium / High

Contenido sexual explícito o sugerente.

Violence

Off / Low / Medium / High

Contenido violento, instrucciones de daño físico.

Self-harm

Off / Low / Medium / High

Contenido que promueve autolesiones o suicidio.

Jailbreak

On / Off

Intentos de hacer que el modelo ignore sus instrucciones de sistema.

Protected material

On / Off

Texto o código con derechos de autor protegidos.

Cómo funciona

1. El usuario envía un prompt → el filtro analiza el input.

2. Si el input supera el umbral configurado → la llamada se bloquea (error 400).

3. El modelo genera respuesta → el filtro analiza el output.

4. Si el output supera el umbral → se devuelve respuesta vacía o un mensaje de error.

5. Todos los eventos de filtrado se registran para auditoría.

Trampa de examen

El content filtering aplica a AMBOS sentidos: input (prompt del usuario) y output (respuesta del modelo). No es solo filtrar lo que dice el modelo — también filtra lo que le preguntan.

El nivel "Off" solo está disponible para clientes aprobados con casos de uso especiales (ej: investigación de seguridad). Por defecto, todos los niveles tienen filtrado activo.

Azure OpenAI vs OpenAI.com

Dimensión	Azure OpenAI	OpenAI.com
Datos de usuario	No se usan para entrenar modelos	Pueden usarse salvo opt-out
Cumplimiento (compliance)	HIPAA, SOC 2, ISO 27001, GDPR	Más limitado
Red privada	VNet, Private Endpoint	Solo internet público
Autenticación	Azure AD / Managed Identity + API key	Solo API key
SLA	99.9% (Microsoft SLA)	Sin SLA formal
Modelos disponibles	Subconjunto de modelos OpenAI	Todos los modelos OpenAI
Velocidad de actualización	Más lenta (requiere validación de Azure)	Más rápida (primero en lanzar)
Precio	Similar, con opción PTU para volumen	Pay-as-you-go estándar

Regla de oro: Azure OpenAI para empresas con requisitos de compliance, datos sensibles (salud, finanzas, legal) o que necesitan integración con su infraestructura Azure existente.

Casos de uso por modelo

Escenario	Modelo	Por qué
Chatbot de atención al cliente 24/7	GPT-3.5-turbo	Económico para alto volumen, suficiente para conversación general
Análisis de contratos legales complejos	GPT-4o	Razonamiento avanzado, contexto largo, análisis matizado
Analizar facturas escaneadas como imagen	GPT-4o (multimodal)	Único modelo que puede "ver" imágenes en Azure OpenAI
Búsqueda semántica en base de documentos	text-embedding-3	Convierte texto a vectores para RAG y búsqueda semántica
Generar ilustraciones para e-commerce	DALL-E 3	Modelo de generación de imágenes desde texto
Transcribir reuniones grabadas	Whisper	STT de alta precisión, 99+ idiomas, disponible en Azure OpenAI
Asistente de código en IDE	GPT-4o / GPT-3.5	GPT-4o para código complejo; GPT-3.5 para autocompletado económico

Microsoft Copilot

Microsoft Copilot es la capa de experiencia de usuario con IA generativa integrada en los productos de Microsoft. Usa Azure OpenAI bajo el capó.

Microsoft 365 Copilot

Microsoft 365

En Word, Excel, PowerPoint, Teams, Outlook. Resume reuniones, genera documentos, analiza datos de Excel.

GitHub Copilot

GitHub

Asistente de código en VS Code y otros IDEs. Autocompletado, generación de tests, explicación de código.

Copilot in Windows

Windows

Asistente en el sistema operativo. Disponible en barra lateral. Usa Bing + GPT-4.

Copilot Studio

Enterprise

Plataforma no-code/low-code para construir copilots personalizados para empresas. Antes Power Virtual Agents.

Copilot in Azure

Azure

Asistente en Azure Portal para IaC, diagnóstico de problemas, consultas de recursos.

Security Copilot

Security

Análisis de amenazas, respuesta a incidentes, generación de reportes de seguridad con lenguaje natural.

Trampa de examen: Copilot vs Azure OpenAI

Microsoft Copilot = producto/experiencia lista para usar (en M365, Windows, GitHub).
Azure OpenAI Service = infraestructura para construir tus propias aplicaciones con modelos de OpenAI.
Copilot Studio = herramienta para construir copilots personalizados sin ser desarrollador.

Trampas frecuentes del examen

❓ ¿Azure OpenAI usa tus datos para entrenar sus modelos?

No. A diferencia de OpenAI.com (salvo opt-out), Azure OpenAI garantiza que los datos del cliente NO se usan para mejorar los modelos. Es una de las diferencias clave frente a la API directa de OpenAI.

❓ ¿El content filtering se aplica solo a las respuestas del modelo?

No. Se aplica tanto al INPUT (prompt del usuario) como al OUTPUT (respuesta del modelo). Si el prompt del usuario contiene contenido dañino, la llamada se bloquea antes de llegar al modelo.

❓ ¿DALL-E genera y también analiza imágenes?

No. DALL-E solo GENERA imágenes a partir de texto. Para ANALIZAR imágenes (describir qué hay en una foto, extraer texto de imagen) se usa GPT-4o (multimodal) o Azure AI Vision. Son capacidades distintas.

❓ ¿Copilot Studio y Azure OpenAI son lo mismo?

No. Copilot Studio es una plataforma low-code para construir bots/copilots personalizados (antes Power Virtual Agents). Azure OpenAI Service es la API para desarrolladores para construir aplicaciones con los modelos de OpenAI. Ambos pueden integrarse, pero son productos diferentes.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Un hospital quiere usar IA generativa para ayudar a los médicos a redactar informes clínicos. Los datos son altamente confidenciales (historias médicas de pacientes). Necesitan garantías de que los datos NO se usarán para entrenar modelos externos y deben cumplir con HIPAA. ¿Qué servicio deben usar?

Inicia sesión para llevar tu progreso.

AnteriorIA Generativa y LLMsIA Generativa SiguienteAzure AI Foundry y catálogo de modelosIA Generativa