CDL

Deep Dive

D3 · IA e innovación con Google Cloud

Fundamentos de IA y Machine Learning

Conceptos clave de IA/ML, tipos de aprendizaje, terminología del examen CDL y el espectro de soluciones de Google Cloud.

IA vs ML vs Deep Learning vs GenAI

Estas cuatro tecnologías se usan en el examen CDL con significados específicos. Entender las diferencias es fundamental.

Inteligencia Artificial (IA)

Campo amplio de la informática que busca crear sistemas capaces de realizar tareas que normalmente requieren inteligencia humana: razonamiento, aprendizaje, percepción, comprensión del lenguaje.

Ejemplos en GCP

Sistemas de recomendación, reconocimiento de voz, traducción automática, juego de ajedrez.

Machine Learning (ML)

Subconjunto de la IA donde los sistemas aprenden patrones de los datos sin ser explícitamente programados para cada caso. El modelo mejora con más datos y retroalimentación.

Ejemplos en GCP

Detección de spam, predicción de churn, detección de fraude, precios dinámicos.

Deep Learning

Subconjunto de ML usando redes neuronales artificiales con muchas capas (deep = profundo). Especialmente bueno para datos no estructurados: imágenes, audio, texto.

Ejemplos en GCP

Reconocimiento de imágenes (Vision API), transcripción de voz (Speech-to-Text), traducción neural.

IA Generativa (GenAI)

Subconjunto de Deep Learning que puede generar nuevo contenido (texto, imágenes, código, audio) que no estaba explícitamente en los datos de entrenamiento. Basado en modelos de fundación como Gemini.

Ejemplos en GCP

Gemini para texto/código, Imagen 3 para imágenes, Chirp para voz. Resumir documentos, escribir código, crear imágenes.

Tipos de aprendizaje automático

Supervisado

El modelo aprende de datos etiquetados — pares (input, output correcto). Aprende a mapear inputs a outputs.

Casos de uso

Clasificación (spam/no spam), regresión (precio de casa), detección de enfermedades.

No supervisado

El modelo aprende patrones de datos SIN etiquetas. Descubre estructura oculta en los datos.

Casos de uso

Segmentación de clientes, detección de anomalías, compresión de imágenes.

Por refuerzo

Un agente aprende por prueba y error: toma acciones, recibe recompensas/penalizaciones y optimiza su política.

Casos de uso

Juegos (AlphaGo), robots, sistemas de recomendación dinámicos, trading.

El espectro de soluciones de IA en Google Cloud

Google Cloud ofrece IA en tres niveles de abstracción. Elige según tu caso de uso y experiencia técnica.

Nivel 1: APIs preentrenadas

Audiencia: Desarrolladores sin experiencia en MLTrade-off: Menos personalización, máxima velocidad

Modelos de Google listos para usar. Sin datos de entrenamiento propios. Solo llamas a la API.

Vision AI — detectar objetos en imágenes

Natural Language API — sentimiento, entidades

Speech-to-Text / Text-to-Speech

Translation API

Document AI

Nivel 2: Vertex AI AutoML

Audiencia: Analistas de datos y desarrolladoresTrade-off: Balance entre personalización y facilidad

Entrena modelos personalizados con tus propios datos, sin escribir código de ML.

AutoML Vision — clasificar imágenes propias

AutoML Tables — predicciones sobre datos tabulares

AutoML Text — clasificar texto específico del negocio

AutoML Video — reconocer acciones en videos

Nivel 3: Custom Training en Vertex AI

Audiencia: Data Scientists y ML EngineersTrade-off: Máxima flexibilidad, mayor complejidad

Control total: escribes tu propio código de ML con cualquier framework.

TensorFlow / Keras para deep learning

PyTorch para investigación

scikit-learn para ML clásico

TPUs y GPUs de Google para escala

Terminología clave del examen CDL

Término	Definición para el CDL
Modelo de fundación	Modelo de IA de gran escala entrenado en enormes cantidades de datos que puede adaptarse a muchas tareas. Ej: Gemini, PaLM, Imagen.
Fine-tuning	Ajustar un modelo de fundación con datos específicos del dominio para mejorar su rendimiento en tareas concretas.
Hallucination	Cuando un LLM genera información factualmente incorrecta con confianza. Reducir con grounding y RAG.
RAG	Retrieval-Augmented Generation: fundamentar respuestas de IA con documentos propios para reducir alucinaciones.
Grounding	Conectar el modelo a fuentes de datos actualizadas (web, documentos propios) para que sus respuestas sean factuales.
Embeddings	Representaciones numéricas (vectores) de texto/imágenes que capturan su significado semántico. Base de búsqueda vectorial.
Temperatura	Parámetro que controla la aleatoriedad del modelo. 0 = determinista. 1+ = más creativo/aleatorio.
Prompt engineering	Técnica de escribir instrucciones efectivas para obtener mejores respuestas de un LLM. Zero-shot, few-shot, chain-of-thought.

APIs preentrenadas de Google Cloud

Las APIs preentrenadas permiten usar capacidades de IA de Google sin datos de entrenamiento propios ni código de ML. Son el nivel de menor esfuerzo en el espectro de IA de GCP.

API	Qué hace	Caso de uso típico
Vision AI	Detecta objetos, texto (OCR), caras, etiquetas y contenido explícito en imágenes. Reconocimiento de landmarks.	Moderación de imágenes, extracción de texto de documentos escaneados, clasificación de fotos.
Natural Language API	Análisis de sentimiento, extracción de entidades, clasificación de contenido y análisis de sintaxis en texto.	Analizar reseñas de clientes, categorizar tickets de soporte, extraer información de contratos.
Cloud Translation API	Traduce texto entre 100+ idiomas. Detección automática del idioma de origen.	Soporte multi-idioma en apps, traducción de contenido, apps globales.
Speech-to-Text	Convierte audio hablado a texto. Soporta 125+ idiomas, vocabulario especializado (médico, telefonía).	Subtítulos automáticos, transcripción de llamadas de soporte, comandos de voz.
Text-to-Speech	Convierte texto a audio con voces naturales (WaveNet). Soporta 220+ voces en 40+ idiomas.	Asistentes de voz, lectores de pantalla, apps de accesibilidad.
Document AI	Extrae datos estructurados de documentos complejos (facturas, contratos, formularios). Va más allá del OCR simple.	Automatizar procesamiento de facturas, onboarding de clientes con KYC, extracción de datos de contratos.
Contact Center as a Service (CCAI Platform)	Plataforma unificada de centro de contacto impulsada por IA: agentes virtuales (Dialogflow CX), asistencia en tiempo real para agentes humanos y análisis de conversaciones. Featured AI product en GCP.	Centros de atención al cliente con IA: desviar llamadas a agentes virtuales, asistir agentes humanos en tiempo real, analizar sentimiento y calidad de llamadas.

Cómo elegir la solución de IA correcta

Para elegir entre APIs preentrenadas, AutoML o Custom Training, evalúa cuatro factores:

Factor	APIs preentrenadas	AutoML	Custom Training
Velocidad	Minutos (solo llamar a la API)	Horas-días (entrenamiento)	Días-semanas
Esfuerzo	Mínimo: sin datos, sin código ML	Medio: datos propios, sin código	Alto: código, arquitectura, tuning
Diferenciación	Baja: todos usan el mismo modelo	Media: modelo con tus datos	Alta: modelo único para tu caso
Expertise requerido	Desarrollador (solo llamadas API)	Analista de datos	Data Scientist / ML Engineer

BigQuery ML — ML sin salir de BigQuery

BigQuery ML permite crear y ejecutar modelos de ML directamente en BigQuery usando SQL estándar. No hay que exportar datos ni aprender un framework de ML. Ideal para data analysts que ya saben SQL y quieren modelos de regresión, clasificación, series temporales o recomendaciones sobre datos que ya están en BigQuery.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa quiere detectar productos defectuosos en su línea de producción usando imágenes de cámaras. No tienen un equipo de ML pero tienen miles de imágenes etiquetadas (defectuoso/no defectuoso). ¿Qué solución de Google Cloud es más adecuada?

Inicia sesión para llevar tu progreso.

AnteriorPipelines de datos: Pub/Sub, Dataflow y LookerExploración de datos con Google Cloud SiguienteVertex AI: plataforma unificada de MLIA e innovación con Google Cloud