CLF-C02
Deep Dive
AWS ofrece servicios de IA/ML pre-entrenados (sin conocimientos de ML) y plataformas para ML personalizado. El CLF-C02 evalúa qué servicio corresponde a cada caso de uso: imágenes, texto, voz, búsqueda o análisis de datos.
Contenido
Servicios de IA pre-construidos
Servicios de alto nivel que agregan capacidades de IA directamente a tus aplicaciones. No necesitas saber ML ni entrenar modelos. Solo llamas a una API y obtienes el resultado.
Amazon SageMaker — ML personalizado
Para cuando los servicios pre-construidos no se adaptan a tu caso de uso y necesitas entrenar tus propios modelos de ML. SageMaker gestiona toda la infraestructura de ML.
Regla de decisión para el examen
Usa servicios pre-construidos (Rekognition, Lex, Comprehend, etc.) cuando el caso de uso es estándar. Usa SageMaker cuando necesitas entrenar un modelo personalizado con tus propios datos y el problema no está resuelto por los servicios pre-construidos.
Amazon SageMaker AI
ML personalizadoPlataforma completa para construir, entrenar y desplegar modelos de Machine Learning. Incluye notebooks Jupyter gestionados, entrenamiento distribuido, AutoML y endpoints de inferencia.
Amazon Rekognition
Visión artificialAnálisis de imágenes y videos con ML. Detección de objetos, escenas, actividades, rostros (identificación y comparación), contenido inapropiado y texto en imágenes.
Amazon Comprehend
Procesamiento de lenguaje natural (NLP)Extrae información y relaciones de texto no estructurado. Análisis de sentimientos (positivo/negativo/neutro), extracción de entidades (personas, lugares, fechas), detección de idioma, clasificación de temas.
Amazon Translate
TraducciónTraducción automática neuronal de alta calidad entre más de 75 pares de idiomas. Ideal para localización de contenido, comunicación multilingüe y análisis de texto en múltiples idiomas.
Amazon Polly
Texto a vozConvierte texto en habla realista (Text-to-Speech / TTS). Ofrece voces naturales en docenas de idiomas y dialectos. Permite voces neuronales más naturales y expresivas.
Amazon Transcribe
Voz a textoReconocimiento automático de voz (ASR). Convierte audio a texto con alta precisión. Soporta múltiples idiomas, identificación de hablantes y vocabulario personalizado.
Amazon Lex
Chatbots / IA conversacionalServicio para construir interfaces conversacionales (chatbots y asistentes de voz) usando la misma tecnología que Amazon Alexa. Comprende intenciones, gestiona conversaciones multi-turno.
Amazon Kendra
Búsqueda empresarial inteligenteMotor de búsqueda empresarial impulsado por ML. Busca en documentos, FAQs, bases de conocimiento y múltiples repositorios de datos devolviendo respuestas directas, no solo lista de links.
Amazon Textract
Extracción de documentosExtrae texto, tablas y datos de formularios de documentos escaneados de forma automática. Va más allá del OCR simple — entiende la estructura del documento (formularios, tablas, campos).
Amazon Q
Asistente de IA generativaAsistente de IA generativa para empresa. Amazon Q Business: asistente conectado a datos empresariales internos. Amazon Q Developer: asistente para desarrolladores integrado en IDE, responde preguntas sobre AWS.
Los servicios de analítica permiten procesar, transformar y visualizar grandes volúmenes de datos.
| Servicio | Función principal | Caso de uso típico | Modelo |
|---|---|---|---|
Amazon Athena | Consultas SQL serverless sobre datos en S3 | "Analiza los logs de acceso de S3 con SQL sin mover los datos" | Pago por consulta (por TB escaneado) |
Amazon Kinesis | Procesamiento de datos en tiempo real (streaming) | Análisis de clickstream en tiempo real, métricas de IoT, logs de aplicaciones | Kinesis Streams + Firehose |
AWS Glue | ETL serverless (Extract, Transform, Load) | Prepara datos de múltiples fuentes para análisis: limpia, transforma y carga en Redshift o S3 | Serverless, pago por uso |
Amazon EMR | Big data con Hadoop/Spark en clusters gestionados | Procesamiento de petabytes de logs con Apache Spark para ML o análisis masivo | Clusters de EC2 bajo demanda |
Amazon OpenSearch | Búsqueda y analítica de logs y datos | Análisis de logs de aplicaciones, búsqueda full-text en documentos, dashboards de operaciones | Instancias gestionadas |
Amazon Redshift | Data warehouse para analítica a escala de petabytes (OLAP) | Reportes de ventas histórico, Business Intelligence, combinado con QuickSight | Clusters gestionados o Serverless |
Amazon QuickSight
Amazon QuickSight es el servicio de Business Intelligence (BI) serverless de AWS. Crea dashboards interactivos y visualizaciones conectados a Redshift, S3 (via Athena), RDS y otras fuentes. No hay icono en la biblioteca pero aparece frecuentemente en el examen: QuickSight = dashboards y visualización de datos.
El examen presenta escenarios donde debes identificar el servicio de IA correcto. Memoriza estas asociaciones:
Análisis de imágenes / detección de objetos / reconocimiento facial
Amazon Rekognition
Chatbot / asistente virtual / IA conversacional
Amazon Lex
Búsqueda inteligente en documentos empresariales
Amazon Kendra
Extraer texto/tablas/datos de documentos escaneados o PDFs
Amazon Textract
Análisis de sentimientos / entidades en texto
Amazon Comprehend
Transcribir audio / grabar llamadas a texto
Amazon Transcribe
Convertir texto a voz (TTS) / narrar contenido
Amazon Polly
Traducir texto entre idiomas
Amazon Translate
Entrenar modelo personalizado / ML propio
Amazon SageMaker
Asistente IA generativa para desarrolladores / AWS
Amazon Q Developer
Consultas SQL sobre datos en S3 sin servidor
Amazon Athena
Datos en streaming / tiempo real / IoT
Amazon Kinesis
Machine Learning / IA
Los modelos de ML predicen, clasifican o generan nueva información basándose en patrones aprendidos de datos históricos.
Servicios: SageMaker, Rekognition, Lex, Comprehend, Polly, Transcribe, Textract
Analítica de datos
Los servicios de analítica consultan, transforman y visualizan datos existentes para extraer insights descriptivos.
Servicios: Athena, Kinesis, Glue, Redshift, EMR, OpenSearch, QuickSight
Trampas frecuentes del examen
• Redshift: es analítica (data warehouse OLAP), NO es ML. Se usa para reportes e BI.
• Athena: SQL sobre S3. Analítica, no ML. Serverless y rápido para exploración de datos.
• Comprehend vs Textract: Comprehend analiza el SIGNIFICADO del texto (sentimiento, entidades). Textract EXTRAE texto de documentos escaneados (OCR avanzado).
• Transcribe vs Polly: Transcribe = audio a texto. Polly = texto a audio. Son inversos.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa de comercio electrónico quiere agregar un asistente virtual a su sitio web para responder preguntas de clientes sobre pedidos, devoluciones y productos sin construir modelos de ML desde cero. ¿Qué servicio de AWS deberían usar?