CDL
Deep Dive
Conceptos clave de IA/ML, tipos de aprendizaje, terminología del examen CDL y el espectro de soluciones de Google Cloud.
Estas cuatro tecnologías se usan en el examen CDL con significados específicos. Entender las diferencias es fundamental.
Campo amplio de la informática que busca crear sistemas capaces de realizar tareas que normalmente requieren inteligencia humana: razonamiento, aprendizaje, percepción, comprensión del lenguaje.
Ejemplos en GCP
Sistemas de recomendación, reconocimiento de voz, traducción automática, juego de ajedrez.
Subconjunto de la IA donde los sistemas aprenden patrones de los datos sin ser explícitamente programados para cada caso. El modelo mejora con más datos y retroalimentación.
Ejemplos en GCP
Detección de spam, predicción de churn, detección de fraude, precios dinámicos.
Subconjunto de ML usando redes neuronales artificiales con muchas capas (deep = profundo). Especialmente bueno para datos no estructurados: imágenes, audio, texto.
Ejemplos en GCP
Reconocimiento de imágenes (Vision API), transcripción de voz (Speech-to-Text), traducción neural.
Subconjunto de Deep Learning que puede generar nuevo contenido (texto, imágenes, código, audio) que no estaba explícitamente en los datos de entrenamiento. Basado en modelos de fundación como Gemini.
Ejemplos en GCP
Gemini para texto/código, Imagen 3 para imágenes, Chirp para voz. Resumir documentos, escribir código, crear imágenes.
Supervisado
El modelo aprende de datos etiquetados — pares (input, output correcto). Aprende a mapear inputs a outputs.
Casos de uso
Clasificación (spam/no spam), regresión (precio de casa), detección de enfermedades.
No supervisado
El modelo aprende patrones de datos SIN etiquetas. Descubre estructura oculta en los datos.
Casos de uso
Segmentación de clientes, detección de anomalías, compresión de imágenes.
Por refuerzo
Un agente aprende por prueba y error: toma acciones, recibe recompensas/penalizaciones y optimiza su política.
Casos de uso
Juegos (AlphaGo), robots, sistemas de recomendación dinámicos, trading.
Google Cloud ofrece IA en tres niveles de abstracción. Elige según tu caso de uso y experiencia técnica.
Modelos de Google listos para usar. Sin datos de entrenamiento propios. Solo llamas a la API.
Entrena modelos personalizados con tus propios datos, sin escribir código de ML.
Control total: escribes tu propio código de ML con cualquier framework.
| Término | Definición para el CDL |
|---|---|
| Modelo de fundación | Modelo de IA de gran escala entrenado en enormes cantidades de datos que puede adaptarse a muchas tareas. Ej: Gemini, PaLM, Imagen. |
| Fine-tuning | Ajustar un modelo de fundación con datos específicos del dominio para mejorar su rendimiento en tareas concretas. |
| Hallucination | Cuando un LLM genera información factualmente incorrecta con confianza. Reducir con grounding y RAG. |
| RAG | Retrieval-Augmented Generation: fundamentar respuestas de IA con documentos propios para reducir alucinaciones. |
| Grounding | Conectar el modelo a fuentes de datos actualizadas (web, documentos propios) para que sus respuestas sean factuales. |
| Embeddings | Representaciones numéricas (vectores) de texto/imágenes que capturan su significado semántico. Base de búsqueda vectorial. |
| Temperatura | Parámetro que controla la aleatoriedad del modelo. 0 = determinista. 1+ = más creativo/aleatorio. |
| Prompt engineering | Técnica de escribir instrucciones efectivas para obtener mejores respuestas de un LLM. Zero-shot, few-shot, chain-of-thought. |
Las APIs preentrenadas permiten usar capacidades de IA de Google sin datos de entrenamiento propios ni código de ML. Son el nivel de menor esfuerzo en el espectro de IA de GCP.
| API | Qué hace | Caso de uso típico |
|---|---|---|
| Vision AI | Detecta objetos, texto (OCR), caras, etiquetas y contenido explícito en imágenes. Reconocimiento de landmarks. | Moderación de imágenes, extracción de texto de documentos escaneados, clasificación de fotos. |
| Natural Language API | Análisis de sentimiento, extracción de entidades, clasificación de contenido y análisis de sintaxis en texto. | Analizar reseñas de clientes, categorizar tickets de soporte, extraer información de contratos. |
| Cloud Translation API | Traduce texto entre 100+ idiomas. Detección automática del idioma de origen. | Soporte multi-idioma en apps, traducción de contenido, apps globales. |
| Speech-to-Text | Convierte audio hablado a texto. Soporta 125+ idiomas, vocabulario especializado (médico, telefonía). | Subtítulos automáticos, transcripción de llamadas de soporte, comandos de voz. |
| Text-to-Speech | Convierte texto a audio con voces naturales (WaveNet). Soporta 220+ voces en 40+ idiomas. | Asistentes de voz, lectores de pantalla, apps de accesibilidad. |
| Document AI | Extrae datos estructurados de documentos complejos (facturas, contratos, formularios). Va más allá del OCR simple. | Automatizar procesamiento de facturas, onboarding de clientes con KYC, extracción de datos de contratos. |
| Contact Center as a Service (CCAI Platform) | Plataforma unificada de centro de contacto impulsada por IA: agentes virtuales (Dialogflow CX), asistencia en tiempo real para agentes humanos y análisis de conversaciones. Featured AI product en GCP. | Centros de atención al cliente con IA: desviar llamadas a agentes virtuales, asistir agentes humanos en tiempo real, analizar sentimiento y calidad de llamadas. |
Para elegir entre APIs preentrenadas, AutoML o Custom Training, evalúa cuatro factores:
| Factor | APIs preentrenadas | AutoML | Custom Training |
|---|---|---|---|
| Velocidad | Minutos (solo llamar a la API) | Horas-días (entrenamiento) | Días-semanas |
| Esfuerzo | Mínimo: sin datos, sin código ML | Medio: datos propios, sin código | Alto: código, arquitectura, tuning |
| Diferenciación | Baja: todos usan el mismo modelo | Media: modelo con tus datos | Alta: modelo único para tu caso |
| Expertise requerido | Desarrollador (solo llamadas API) | Analista de datos | Data Scientist / ML Engineer |
BigQuery ML — ML sin salir de BigQuery
BigQuery ML permite crear y ejecutar modelos de ML directamente en BigQuery usando SQL estándar. No hay que exportar datos ni aprender un framework de ML. Ideal para data analysts que ya saben SQL y quieren modelos de regresión, clasificación, series temporales o recomendaciones sobre datos que ya están en BigQuery.
¿Entendiste este tema?
Pon a prueba lo que acabas de aprender
Una empresa quiere detectar productos defectuosos en su línea de producción usando imágenes de cámaras. No tienen un equipo de ML pero tienen miles de imágenes etiquetadas (defectuoso/no defectuoso). ¿Qué solución de Google Cloud es más adecuada?