AI-901
Deep Dive
Azure OpenAI Service da acceso empresarial a los modelos de OpenAI (GPT-4, DALL-E, Whisper) con la infraestructura, seguridad y compliance de Azure. El AI-901 evalúa qué modelos usar en qué escenario y cómo funciona el content filtering.
Contenido
Azure OpenAI Service es el servicio de Azure que proporciona acceso a los modelos de OpenAI (GPT-4, GPT-3.5, DALL-E, Whisper, embeddings) con las garantías de la plataforma Azure: cumplimiento normativo, RBAC, red privada, SLA empresarial y los datos del cliente no se usan para entrenar los modelos.
🏢
Acceso enterprise
Los modelos se despliegan en tu propia región de Azure. Los datos no se comparten con OpenAI ni se usan para mejorar el modelo base.
🔌
Misma API
Compatible con la API de OpenAI. Puedes migrar aplicaciones existentes cambiando solo el endpoint y la clave.
✅
Compliance
SOC 2, ISO 27001, HIPAA, GDPR. Redes privadas con VNet. Integra con Azure AD/Entra ID para RBAC.
GPT-4o / GPT-4
Chat & Completions
Razonamiento complejo, análisis de imágenes, código avanzado, generación larga.
GPT-3.5-turbo
Chat & Completions
Chatbots, resúmenes, clasificación, extracción. Económico para alto volumen.
text-embedding-ada-002 / text-embedding-3
Embeddings
Convertir texto en vectores para RAG, búsqueda semántica, clustering.
DALL-E 3
Image Generation
Generar imágenes a partir de texto. Marketing, diseño, prototipos visuales.
Whisper
Speech-to-Text
Transcripción de audio. 99+ idiomas. Disponible vía Azure OpenAI.
Embeddings — qué son y para qué sirven
Los embeddings convierten texto en vectores numéricos que capturan el significado semántico. Textos similares tienen vectores similares. Se usan para: RAG (encontrar documentos relevantes), búsqueda semántica (buscar por significado, no por palabras exactas), y clustering (agrupar documentos por tema). Modelo a usar en Azure: text-embedding-3-small o text-embedding-3-large.
En Azure OpenAI, primero creas un deployment (instancia del modelo) con un nombre personalizado. Las llamadas a la API usan ese nombre de deployment, no el nombre del modelo base. Esto permite versionar y controlar el modelo exacto en uso.
Crear recurso Azure OpenAI
En Azure Portal o CLI. Elegir región (disponibilidad de modelos varía por región).
Crear deployment
Seleccionar modelo base (ej: gpt-4o), darle un nombre personalizado (ej: "mi-gpt4-prod"), configurar quota de tokens por minuto.
Obtener endpoint y API key
URL del endpoint: https://{recurso}.openai.azure.com/. API key desde Azure Portal o usar Managed Identity.
Llamar a la API
REST API o SDK (Python, C#, JavaScript). Parámetro "deployment_name" en vez de "model" de la API de OpenAI.com.
Tipos de deployment
Trampa de examen: nombre de deployment
En Azure OpenAI, la API recibe el nombre del deployment (que eliges tú), no el nombre del modelo. Dos deployments pueden usar el mismo modelo base con distintos nombres. Esto se pregunta en el examen.
Azure OpenAI Playground
Interfaz web para probar modelos interactivamente sin escribir código. Permite experimentar con system prompts, parámetros y ver el código generado.
Azure AI Studio (AI Foundry)
Portal unificado para construir y desplegar aplicaciones de IA generativa. Va más allá del playground: incluye pipelines, evaluación, RAG y model catalog.
Examen: Azure OpenAI Playground vs AI Studio
Playground = probar modelos rápidamente. AI Studio = construir y desplegar aplicaciones completas de GenAI.
Azure OpenAI incluye un sistema de filtrado de contenido que se aplica tanto a los prompts (input) como a las respuestas (output). Clasifica contenido en categorías de daño y puede bloquear o registrar según el nivel configurado.
Hate
Off / Low / Medium / HighDiscurso de odio, discriminación por raza, género, religión, origen.
Sexual
Off / Low / Medium / HighContenido sexual explícito o sugerente.
Violence
Off / Low / Medium / HighContenido violento, instrucciones de daño físico.
Self-harm
Off / Low / Medium / HighContenido que promueve autolesiones o suicidio.
Jailbreak
On / OffIntentos de hacer que el modelo ignore sus instrucciones de sistema.
Protected material
On / OffTexto o código con derechos de autor protegidos.
Cómo funciona
1. El usuario envía un prompt → el filtro analiza el input.
2. Si el input supera el umbral configurado → la llamada se bloquea (error 400).
3. El modelo genera respuesta → el filtro analiza el output.
4. Si el output supera el umbral → se devuelve respuesta vacía o un mensaje de error.
5. Todos los eventos de filtrado se registran para auditoría.
Trampa de examen
El content filtering aplica a AMBOS sentidos: input (prompt del usuario) y output (respuesta del modelo). No es solo filtrar lo que dice el modelo — también filtra lo que le preguntan.
El nivel "Off" solo está disponible para clientes aprobados con casos de uso especiales (ej: investigación de seguridad). Por defecto, todos los niveles tienen filtrado activo.
| Dimensión | Azure OpenAI | OpenAI.com |
|---|---|---|
| Datos de usuario | No se usan para entrenar modelos | Pueden usarse salvo opt-out |
| Cumplimiento (compliance) | HIPAA, SOC 2, ISO 27001, GDPR | Más limitado |
| Red privada | VNet, Private Endpoint | Solo internet público |
| Autenticación | Azure AD / Managed Identity + API key | Solo API key |
| SLA | 99.9% (Microsoft SLA) | Sin SLA formal |
| Modelos disponibles | Subconjunto de modelos OpenAI | Todos los modelos OpenAI |
| Velocidad de actualización | Más lenta (requiere validación de Azure) | Más rápida (primero en lanzar) |
| Precio | Similar, con opción PTU para volumen | Pay-as-you-go estándar |
Regla de oro: Azure OpenAI para empresas con requisitos de compliance, datos sensibles (salud, finanzas, legal) o que necesitan integración con su infraestructura Azure existente.
| Escenario | Modelo | Por qué |
|---|---|---|
| Chatbot de atención al cliente 24/7 | GPT-3.5-turbo | Económico para alto volumen, suficiente para conversación general |
| Análisis de contratos legales complejos | GPT-4o | Razonamiento avanzado, contexto largo, análisis matizado |
| Analizar facturas escaneadas como imagen | GPT-4o (multimodal) | Único modelo que puede "ver" imágenes en Azure OpenAI |
| Búsqueda semántica en base de documentos | text-embedding-3 | Convierte texto a vectores para RAG y búsqueda semántica |
| Generar ilustraciones para e-commerce | DALL-E 3 | Modelo de generación de imágenes desde texto |
| Transcribir reuniones grabadas | Whisper | STT de alta precisión, 99+ idiomas, disponible en Azure OpenAI |
| Asistente de código en IDE | GPT-4o / GPT-3.5 | GPT-4o para código complejo; GPT-3.5 para autocompletado económico |
Microsoft Copilot es la capa de experiencia de usuario con IA generativa integrada en los productos de Microsoft. Usa Azure OpenAI bajo el capó.
Microsoft 365 Copilot
Microsoft 365En Word, Excel, PowerPoint, Teams, Outlook. Resume reuniones, genera documentos, analiza datos de Excel.
GitHub Copilot
GitHubAsistente de código en VS Code y otros IDEs. Autocompletado, generación de tests, explicación de código.
Copilot in Windows
WindowsAsistente en el sistema operativo. Disponible en barra lateral. Usa Bing + GPT-4.
Copilot Studio
EnterprisePlataforma no-code/low-code para construir copilots personalizados para empresas. Antes Power Virtual Agents.
Copilot in Azure
AzureAsistente en Azure Portal para IaC, diagnóstico de problemas, consultas de recursos.
Security Copilot
SecurityAnálisis de amenazas, respuesta a incidentes, generación de reportes de seguridad con lenguaje natural.
Trampa de examen: Copilot vs Azure OpenAI
Microsoft Copilot = producto/experiencia lista para usar (en M365, Windows, GitHub).
Azure OpenAI Service = infraestructura para construir tus propias aplicaciones con modelos de OpenAI.
Copilot Studio = herramienta para construir copilots personalizados sin ser desarrollador.
❓ ¿Azure OpenAI usa tus datos para entrenar sus modelos?
No. A diferencia de OpenAI.com (salvo opt-out), Azure OpenAI garantiza que los datos del cliente NO se usan para mejorar los modelos. Es una de las diferencias clave frente a la API directa de OpenAI.
❓ ¿El content filtering se aplica solo a las respuestas del modelo?
No. Se aplica tanto al INPUT (prompt del usuario) como al OUTPUT (respuesta del modelo). Si el prompt del usuario contiene contenido dañino, la llamada se bloquea antes de llegar al modelo.
❓ ¿DALL-E genera y también analiza imágenes?
No. DALL-E solo GENERA imágenes a partir de texto. Para ANALIZAR imágenes (describir qué hay en una foto, extraer texto de imagen) se usa GPT-4o (multimodal) o Azure AI Vision. Son capacidades distintas.
❓ ¿Copilot Studio y Azure OpenAI son lo mismo?
No. Copilot Studio es una plataforma low-code para construir bots/copilots personalizados (antes Power Virtual Agents). Azure OpenAI Service es la API para desarrolladores para construir aplicaciones con los modelos de OpenAI. Ambos pueden integrarse, pero son productos diferentes.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Un hospital quiere usar IA generativa para ayudar a los médicos a redactar informes clínicos. Los datos son altamente confidenciales (historias médicas de pacientes). Necesitan garantías de que los datos NO se usarán para entrenar modelos externos y deben cumplir con HIPAA. ¿Qué servicio deben usar?