AI-901
Deep Dive
Azure tiene cuatro servicios principales para NLP: Language (análisis de texto), Speech (voz), Translator (traducción) y Bot Service (conversación). El AI-901 prueba cuál usar en cada escenario.
Contenido
💬
Azure AI Language
Análisis y comprensión de texto escrito: sentiment, NER, key phrases, clasificación, resumen, preguntas y respuestas.
🎤
Azure AI Speech
Procesamiento de voz: transcripción (STT), síntesis (TTS), traducción de voz, reconocimiento de locutor.
🌍
Azure Translator
Traducción de texto entre 100+ idiomas. Detección automática del idioma de origen. API REST simple.
🤖
Azure Bot Service
Plataforma para construir, alojar y conectar bots conversacionales a múltiples canales: Teams, web, WhatsApp, etc.
Servicio unificado que agrupa todas las capacidades de análisis de texto. Anteriormente eran servicios separados (Text Analytics, LUIS, QnA Maker) — ahora están consolidados.
Sentiment Analysis
Detecta opinión positiva/negativa/neutral. Soporta opinion mining por aspecto.
Key Phrase Extraction
Extrae los temas y conceptos principales de un texto.
Named Entity Recognition
Identifica entidades: personas, lugares, fechas, organizaciones, cantidades.
Entity Linking
Vincula entidades a su artículo de Wikipedia/Bing para desambiguación.
Language Detection
Identifica el idioma de un texto con score de confianza.
Text Summarization
Extractiva (extrae frases clave) o abstractiva (genera resumen nuevo).
PII Detection
Detecta y opcionalmente redacta información personal identificable.
Custom Text Classification
Entrena clasificador con tus propias categorías usando pocos ejemplos.
Custom NER
Entrena reconocedor de entidades personalizadas para tu dominio específico.
Prebuilt vs Custom
Prebuilt (sin entrenamiento)
Sentiment, NER, Key Phrases, Language Detection, Entity Linking, PII Detection, Summarization. Funciona inmediatamente sin datos de entrenamiento.
Custom (con entrenamiento)
Custom Text Classification, Custom NER, Conversational Language Understanding, Custom Question Answering. Requieren datos de entrenamiento etiquetados.
CLU (sucesor de LUIS) permite entrenar modelos que comprenden la intención detrás de un mensaje y extraen entidades específicas de la conversación.
Intenciones (Intents)
Lo que el usuario quiere hacer. Cada utterance se clasifica en una intención.
"Reserva un vuelo a Madrid"
→ Intent: ReservarVuelo
Entidades (Entities)
Los datos específicos dentro del mensaje que el sistema necesita para actuar.
"Reserva un vuelo a Madrid"
→ Destino: "Madrid"
Utterances
Ejemplos de cómo los usuarios expresan cada intención. Se usan para entrenar el modelo.
"Quiero ir a Barcelona"
"Necesito un billete a Roma"
"Viaje a París por favor"
Trampa de examen: CLU vs Sentiment
CLU entiende intenciones para construir bots conversacionales (¿qué quiere hacer el usuario?). Sentiment Analysis detecta tono emocional (¿está contento o molesto?). Un bot de pedidos usa CLU; un análisis de reseñas usa Sentiment.
Permite crear una base de conocimiento de pares pregunta-respuesta, y luego el modelo responde preguntas en lenguaje natural buscando la respuesta más adecuada. Sucesor de QnA Maker.
CLU vs Question Answering
CLU: el usuario da una instrucción ("reserva un vuelo") → el bot entiende la intención y actúa.
Question Answering: el usuario hace una pregunta ("¿cuánto cuesta el envío?") → el bot busca y devuelve la respuesta de la base de conocimiento.
Speech-to-Text (STT)
Transcripción de voz a texto en tiempo real o por lotes. 100+ idiomas.
Transcribir llamadas de soporte, reuniones, dictado médico.
Text-to-Speech (TTS)
400+ voces neurales en 140+ idiomas. Natural y expresivo.
Asistentes de voz, accesibilidad, anuncios automatizados.
Speech Translation
STT + Traducción + TTS en una sola llamada. Tiempo real.
Llamadas de conferencia multilingüe, subtítulos en vivo.
Speaker Recognition
Identifica quién habló basándose en características vocales únicas.
Autenticación por voz, diarización (quién habló cuándo).
Custom Speech
Adapta STT con pronunciaciones y vocabulario específico de tu dominio.
Términos médicos, nombres propios, jerga técnica.
Custom Neural Voice
Crea una voz sintética única para tu marca.
Asistentes virtuales con identidad de marca consistente.
Speech Translation vs Azure Translator
Speech Translation (parte de Azure Speech): voz → texto traducido → voz. Un solo servicio, tiempo real.
Azure Translator: texto → texto traducido. Solo texto, no voz.
Capacidades principales
Document Translation
Traduce documentos completos (PDF, Word, PowerPoint) conservando el formato original. Ideal para localización masiva de contenido.
Custom Translator
Usa tus propias traducciones pasadas para entrenar un modelo personalizado. Útil para industrias con terminología específica: legal, médica, técnica.
Examen: cuándo usar Translator
Texto → Texto en otro idioma. Si hay voz involucrada → Azure Speech (Speech Translation). Si necesitas analizar el texto → Azure Language.
Plataforma para construir, alojar y conectar bots conversacionales. Azure Bot Service no incluye IA de comprensión — proporciona la infraestructura y canales. La inteligencia viene de CLU, Question Answering u otros servicios que se integran.
Qué hace Azure Bot Service
Arquitectura típica
| Escenario | Servicio | Feature específica |
|---|---|---|
| Analizar reseñas de productos para saber si son positivas o negativas | Azure AI Language | Sentiment Analysis |
| Extraer nombres de médicos y hospitales de informes clínicos | Azure AI Language | Custom NER o NER prebuilt |
| Construir un bot que entienda "quiero pedir una pizza grande" | Azure AI Language | CLU (Conversational Language Understanding) |
| Crear un chatbot de FAQ para el área de RRHH | Azure AI Language | Question Answering |
| Transcribir llamadas de call center a texto | Azure AI Speech | Speech-to-Text (STT) |
| Generar audio para lectores de pantalla | Azure AI Speech | Text-to-Speech (TTS) |
| Traducir transcripción en vivo de conferencia a 5 idiomas | Azure AI Speech | Speech Translation |
| Traducir 10.000 documentos Word al portugués | Azure Translator | Document Translation |
| Detectar en qué idioma está un correo recibido | Azure AI Language o Translator | Language Detection |
| Desplegar bot en Teams, web y WhatsApp simultáneamente | Azure Bot Service | Multi-channel deployment |
❓ ¿LUIS y QnA Maker siguen siendo servicios separados?
No. LUIS fue reemplazado por CLU (Conversational Language Understanding) y QnA Maker fue reemplazado por Question Answering — ambos están ahora integrados en Azure AI Language Service. El examen puede usar los nombres nuevos o los antiguos.
❓ ¿Azure Bot Service tiene IA incorporada?
No directamente. Bot Service es la plataforma/infraestructura para el bot. La comprensión de lenguaje viene de CLU o Question Answering, que se integran como servicios separados. Bot Service gestiona canales, autenticación y alojamiento.
❓ ¿Puedo usar Language Detection para saber si un texto es spam?
No. Language Detection solo detecta el IDIOMA del texto. Para clasificar texto como spam/no-spam se usa Custom Text Classification (Azure AI Language). Son capacidades completamente distintas.
❓ ¿Azure Speech puede analizar el sentimiento de la voz?
Azure Speech transcribe voz a texto. Para analizar el sentimiento, necesitarías pasar el texto resultante a Azure AI Language → Sentiment Analysis. No existe análisis directo de sentimiento en audio dentro de los servicios mencionados en AI-901.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa de retail quiere implementar un chatbot en su web y en WhatsApp que: (1) entienda cuando un cliente dice 'quiero devolver mi pedido' o 'necesito hacer una devolución', y (2) responda preguntas de la política de devoluciones. ¿Qué servicios Azure necesitan?