AI-901

Deep Dive

Practicar ahora
D4 · NLP y Procesamiento de Lenguaje

Servicios Azure de Lenguaje — Language, Speech, Translator y Bot

Azure tiene cuatro servicios principales para NLP: Language (análisis de texto), Speech (voz), Translator (traducción) y Bot Service (conversación). El AI-901 prueba cuál usar en cada escenario.

Mapa de servicios de lenguaje en Azure

💬

Azure AI Language

Análisis y comprensión de texto escrito: sentiment, NER, key phrases, clasificación, resumen, preguntas y respuestas.

🎤

Azure AI Speech

Procesamiento de voz: transcripción (STT), síntesis (TTS), traducción de voz, reconocimiento de locutor.

🌍

Azure Translator

Traducción de texto entre 100+ idiomas. Detección automática del idioma de origen. API REST simple.

🤖

Azure Bot Service

Plataforma para construir, alojar y conectar bots conversacionales a múltiples canales: Teams, web, WhatsApp, etc.

Azure AI Language Service

Servicio unificado que agrupa todas las capacidades de análisis de texto. Anteriormente eran servicios separados (Text Analytics, LUIS, QnA Maker) — ahora están consolidados.

😊

Sentiment Analysis

Detecta opinión positiva/negativa/neutral. Soporta opinion mining por aspecto.

🔑

Key Phrase Extraction

Extrae los temas y conceptos principales de un texto.

🏷️

Named Entity Recognition

Identifica entidades: personas, lugares, fechas, organizaciones, cantidades.

🔗

Entity Linking

Vincula entidades a su artículo de Wikipedia/Bing para desambiguación.

🌐

Language Detection

Identifica el idioma de un texto con score de confianza.

📝

Text Summarization

Extractiva (extrae frases clave) o abstractiva (genera resumen nuevo).

🔒

PII Detection

Detecta y opcionalmente redacta información personal identificable.

🗂️

Custom Text Classification

Entrena clasificador con tus propias categorías usando pocos ejemplos.

Custom NER

Entrena reconocedor de entidades personalizadas para tu dominio específico.

Prebuilt vs Custom

Prebuilt (sin entrenamiento)

Sentiment, NER, Key Phrases, Language Detection, Entity Linking, PII Detection, Summarization. Funciona inmediatamente sin datos de entrenamiento.

Custom (con entrenamiento)

Custom Text Classification, Custom NER, Conversational Language Understanding, Custom Question Answering. Requieren datos de entrenamiento etiquetados.

CLU — Conversational Language Understanding

CLU (sucesor de LUIS) permite entrenar modelos que comprenden la intención detrás de un mensaje y extraen entidades específicas de la conversación.

Intenciones (Intents)

Lo que el usuario quiere hacer. Cada utterance se clasifica en una intención.

"Reserva un vuelo a Madrid"

→ Intent: ReservarVuelo

Entidades (Entities)

Los datos específicos dentro del mensaje que el sistema necesita para actuar.

"Reserva un vuelo a Madrid"

→ Destino: "Madrid"

Utterances

Ejemplos de cómo los usuarios expresan cada intención. Se usan para entrenar el modelo.

"Quiero ir a Barcelona"

"Necesito un billete a Roma"

"Viaje a París por favor"

Trampa de examen: CLU vs Sentiment

CLU entiende intenciones para construir bots conversacionales (¿qué quiere hacer el usuario?). Sentiment Analysis detecta tono emocional (¿está contento o molesto?). Un bot de pedidos usa CLU; un análisis de reseñas usa Sentiment.

Question Answering (QnA)

Permite crear una base de conocimiento de pares pregunta-respuesta, y luego el modelo responde preguntas en lenguaje natural buscando la respuesta más adecuada. Sucesor de QnA Maker.

Fuentes de conocimiento

URLs de páginas web de preguntas frecuentes
Documentos PDF, Word, Excel
Pares Q&A escritos manualmente
Editorial (preguntas generadas automáticamente)

Casos de uso

Bot de soporte técnico con FAQ
Asistente de onboarding de empleados
Bot de preguntas sobre políticas de empresa
FAQ de e-commerce (devoluciones, envíos)

CLU vs Question Answering

CLU: el usuario da una instrucción ("reserva un vuelo") → el bot entiende la intención y actúa.
Question Answering: el usuario hace una pregunta ("¿cuánto cuesta el envío?") → el bot busca y devuelve la respuesta de la base de conocimiento.

Azure AI Speech

Speech-to-Text (STT)

Transcripción de voz a texto en tiempo real o por lotes. 100+ idiomas.

Transcribir llamadas de soporte, reuniones, dictado médico.

Text-to-Speech (TTS)

400+ voces neurales en 140+ idiomas. Natural y expresivo.

Asistentes de voz, accesibilidad, anuncios automatizados.

Speech Translation

STT + Traducción + TTS en una sola llamada. Tiempo real.

Llamadas de conferencia multilingüe, subtítulos en vivo.

Speaker Recognition

Identifica quién habló basándose en características vocales únicas.

Autenticación por voz, diarización (quién habló cuándo).

Custom Speech

Adapta STT con pronunciaciones y vocabulario específico de tu dominio.

Términos médicos, nombres propios, jerga técnica.

Custom Neural Voice

Crea una voz sintética única para tu marca.

Asistentes virtuales con identidad de marca consistente.

Speech Translation vs Azure Translator

Speech Translation (parte de Azure Speech): voz → texto traducido → voz. Un solo servicio, tiempo real.
Azure Translator: texto → texto traducido. Solo texto, no voz.

Azure Translator

Capacidades principales

Traducción de texto: 100+ idiomas, detección automática del idioma origen.
Transliteración: Convierte entre sistemas de escritura sin traducir.
Detección de idioma: Identifica el idioma de un texto antes o sin traducir.
Diccionario: Traducciones alternativas y ejemplos contextuales.
Custom Translator: Adapta el modelo con terminología específica de dominio.

Document Translation

Traduce documentos completos (PDF, Word, PowerPoint) conservando el formato original. Ideal para localización masiva de contenido.

Custom Translator

Usa tus propias traducciones pasadas para entrenar un modelo personalizado. Útil para industrias con terminología específica: legal, médica, técnica.

Examen: cuándo usar Translator

Texto → Texto en otro idioma. Si hay voz involucrada → Azure Speech (Speech Translation). Si necesitas analizar el texto → Azure Language.

Icon-machinelearning-165

Azure Bot Service

Plataforma para construir, alojar y conectar bots conversacionales. Azure Bot Service no incluye IA de comprensión — proporciona la infraestructura y canales. La inteligencia viene de CLU, Question Answering u otros servicios que se integran.

Qué hace Azure Bot Service

Aloja el código del bot
Gestiona autenticación y sesiones
Conecta con múltiples canales (Teams, web, WhatsApp)
Proporciona Bot Framework SDK
Monitoreo y analytics de conversaciones

Arquitectura típica

Azure Bot ServiceInfraestructura, canales, alojamiento
CLUComprende intenciones del usuario
Question AnsweringResponde preguntas de FAQ
Azure LanguageSentiment, NER si se necesita

¿Cuándo usar cada servicio?

EscenarioServicioFeature específica
Analizar reseñas de productos para saber si son positivas o negativasAzure AI LanguageSentiment Analysis
Extraer nombres de médicos y hospitales de informes clínicosAzure AI LanguageCustom NER o NER prebuilt
Construir un bot que entienda "quiero pedir una pizza grande"Azure AI LanguageCLU (Conversational Language Understanding)
Crear un chatbot de FAQ para el área de RRHHAzure AI LanguageQuestion Answering
Transcribir llamadas de call center a textoAzure AI SpeechSpeech-to-Text (STT)
Generar audio para lectores de pantallaAzure AI SpeechText-to-Speech (TTS)
Traducir transcripción en vivo de conferencia a 5 idiomasAzure AI SpeechSpeech Translation
Traducir 10.000 documentos Word al portuguésAzure TranslatorDocument Translation
Detectar en qué idioma está un correo recibidoAzure AI Language o TranslatorLanguage Detection
Desplegar bot en Teams, web y WhatsApp simultáneamenteAzure Bot ServiceMulti-channel deployment

Trampas frecuentes del examen

¿LUIS y QnA Maker siguen siendo servicios separados?

No. LUIS fue reemplazado por CLU (Conversational Language Understanding) y QnA Maker fue reemplazado por Question Answering — ambos están ahora integrados en Azure AI Language Service. El examen puede usar los nombres nuevos o los antiguos.

¿Azure Bot Service tiene IA incorporada?

No directamente. Bot Service es la plataforma/infraestructura para el bot. La comprensión de lenguaje viene de CLU o Question Answering, que se integran como servicios separados. Bot Service gestiona canales, autenticación y alojamiento.

¿Puedo usar Language Detection para saber si un texto es spam?

No. Language Detection solo detecta el IDIOMA del texto. Para clasificar texto como spam/no-spam se usa Custom Text Classification (Azure AI Language). Son capacidades completamente distintas.

¿Azure Speech puede analizar el sentimiento de la voz?

Azure Speech transcribe voz a texto. Para analizar el sentimiento, necesitarías pasar el texto resultante a Azure AI Language → Sentiment Analysis. No existe análisis directo de sentimiento en audio dentro de los servicios mencionados en AI-901.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa de retail quiere implementar un chatbot en su web y en WhatsApp que: (1) entienda cuando un cliente dice 'quiero devolver mi pedido' o 'necesito hacer una devolución', y (2) responda preguntas de la política de devoluciones. ¿Qué servicios Azure necesitan?