CDL

Deep Dive

Practicar ahora
D3 · IA e innovación con Google Cloud

Fundamentos de IA y Machine Learning

Conceptos clave de IA/ML, tipos de aprendizaje, terminología del examen CDL y el espectro de soluciones de Google Cloud.

IA vs ML vs Deep Learning vs GenAI

Estas cuatro tecnologías se usan en el examen CDL con significados específicos. Entender las diferencias es fundamental.

Inteligencia Artificial (IA)

Campo amplio de la informática que busca crear sistemas capaces de realizar tareas que normalmente requieren inteligencia humana: razonamiento, aprendizaje, percepción, comprensión del lenguaje.

Ejemplos en GCP

Sistemas de recomendación, reconocimiento de voz, traducción automática, juego de ajedrez.

Machine Learning (ML)

Subconjunto de la IA donde los sistemas aprenden patrones de los datos sin ser explícitamente programados para cada caso. El modelo mejora con más datos y retroalimentación.

Ejemplos en GCP

Detección de spam, predicción de churn, detección de fraude, precios dinámicos.

Deep Learning

Subconjunto de ML usando redes neuronales artificiales con muchas capas (deep = profundo). Especialmente bueno para datos no estructurados: imágenes, audio, texto.

Ejemplos en GCP

Reconocimiento de imágenes (Vision API), transcripción de voz (Speech-to-Text), traducción neural.

IA Generativa (GenAI)

Subconjunto de Deep Learning que puede generar nuevo contenido (texto, imágenes, código, audio) que no estaba explícitamente en los datos de entrenamiento. Basado en modelos de fundación como Gemini.

Ejemplos en GCP

Gemini para texto/código, Imagen 3 para imágenes, Chirp para voz. Resumir documentos, escribir código, crear imágenes.

Tipos de aprendizaje automático

Supervisado

El modelo aprende de datos etiquetados — pares (input, output correcto). Aprende a mapear inputs a outputs.

Casos de uso

Clasificación (spam/no spam), regresión (precio de casa), detección de enfermedades.

No supervisado

El modelo aprende patrones de datos SIN etiquetas. Descubre estructura oculta en los datos.

Casos de uso

Segmentación de clientes, detección de anomalías, compresión de imágenes.

Por refuerzo

Un agente aprende por prueba y error: toma acciones, recibe recompensas/penalizaciones y optimiza su política.

Casos de uso

Juegos (AlphaGo), robots, sistemas de recomendación dinámicos, trading.

El espectro de soluciones de IA en Google Cloud

Google Cloud ofrece IA en tres niveles de abstracción. Elige según tu caso de uso y experiencia técnica.

Nivel 1: APIs preentrenadas
Audiencia: Desarrolladores sin experiencia en MLTrade-off: Menos personalización, máxima velocidad

Modelos de Google listos para usar. Sin datos de entrenamiento propios. Solo llamas a la API.

Vision AI — detectar objetos en imágenes
Natural Language API — sentimiento, entidades
Speech-to-Text / Text-to-Speech
Translation API
Document AI
Nivel 2: Vertex AI AutoML
Audiencia: Analistas de datos y desarrolladoresTrade-off: Balance entre personalización y facilidad

Entrena modelos personalizados con tus propios datos, sin escribir código de ML.

AutoML Vision — clasificar imágenes propias
AutoML Tables — predicciones sobre datos tabulares
AutoML Text — clasificar texto específico del negocio
AutoML Video — reconocer acciones en videos
Nivel 3: Custom Training en Vertex AI
Audiencia: Data Scientists y ML EngineersTrade-off: Máxima flexibilidad, mayor complejidad

Control total: escribes tu propio código de ML con cualquier framework.

TensorFlow / Keras para deep learning
PyTorch para investigación
scikit-learn para ML clásico
TPUs y GPUs de Google para escala

Terminología clave del examen CDL

TérminoDefinición para el CDL
Modelo de fundaciónModelo de IA de gran escala entrenado en enormes cantidades de datos que puede adaptarse a muchas tareas. Ej: Gemini, PaLM, Imagen.
Fine-tuningAjustar un modelo de fundación con datos específicos del dominio para mejorar su rendimiento en tareas concretas.
HallucinationCuando un LLM genera información factualmente incorrecta con confianza. Reducir con grounding y RAG.
RAGRetrieval-Augmented Generation: fundamentar respuestas de IA con documentos propios para reducir alucinaciones.
GroundingConectar el modelo a fuentes de datos actualizadas (web, documentos propios) para que sus respuestas sean factuales.
EmbeddingsRepresentaciones numéricas (vectores) de texto/imágenes que capturan su significado semántico. Base de búsqueda vectorial.
TemperaturaParámetro que controla la aleatoriedad del modelo. 0 = determinista. 1+ = más creativo/aleatorio.
Prompt engineeringTécnica de escribir instrucciones efectivas para obtener mejores respuestas de un LLM. Zero-shot, few-shot, chain-of-thought.

APIs preentrenadas de Google Cloud

Las APIs preentrenadas permiten usar capacidades de IA de Google sin datos de entrenamiento propios ni código de ML. Son el nivel de menor esfuerzo en el espectro de IA de GCP.

APIQué haceCaso de uso típico
Vision AIDetecta objetos, texto (OCR), caras, etiquetas y contenido explícito en imágenes. Reconocimiento de landmarks.Moderación de imágenes, extracción de texto de documentos escaneados, clasificación de fotos.
Natural Language APIAnálisis de sentimiento, extracción de entidades, clasificación de contenido y análisis de sintaxis en texto.Analizar reseñas de clientes, categorizar tickets de soporte, extraer información de contratos.
Cloud Translation APITraduce texto entre 100+ idiomas. Detección automática del idioma de origen.Soporte multi-idioma en apps, traducción de contenido, apps globales.
Speech-to-TextConvierte audio hablado a texto. Soporta 125+ idiomas, vocabulario especializado (médico, telefonía).Subtítulos automáticos, transcripción de llamadas de soporte, comandos de voz.
Text-to-SpeechConvierte texto a audio con voces naturales (WaveNet). Soporta 220+ voces en 40+ idiomas.Asistentes de voz, lectores de pantalla, apps de accesibilidad.
Document AIExtrae datos estructurados de documentos complejos (facturas, contratos, formularios). Va más allá del OCR simple.Automatizar procesamiento de facturas, onboarding de clientes con KYC, extracción de datos de contratos.
Contact Center as a Service (CCAI Platform)Plataforma unificada de centro de contacto impulsada por IA: agentes virtuales (Dialogflow CX), asistencia en tiempo real para agentes humanos y análisis de conversaciones. Featured AI product en GCP.Centros de atención al cliente con IA: desviar llamadas a agentes virtuales, asistir agentes humanos en tiempo real, analizar sentimiento y calidad de llamadas.

Cómo elegir la solución de IA correcta

Para elegir entre APIs preentrenadas, AutoML o Custom Training, evalúa cuatro factores:

FactorAPIs preentrenadasAutoMLCustom Training
VelocidadMinutos (solo llamar a la API)Horas-días (entrenamiento)Días-semanas
EsfuerzoMínimo: sin datos, sin código MLMedio: datos propios, sin códigoAlto: código, arquitectura, tuning
DiferenciaciónBaja: todos usan el mismo modeloMedia: modelo con tus datosAlta: modelo único para tu caso
Expertise requeridoDesarrollador (solo llamadas API)Analista de datosData Scientist / ML Engineer

BigQuery ML — ML sin salir de BigQuery

BigQuery ML permite crear y ejecutar modelos de ML directamente en BigQuery usando SQL estándar. No hay que exportar datos ni aprender un framework de ML. Ideal para data analysts que ya saben SQL y quieren modelos de regresión, clasificación, series temporales o recomendaciones sobre datos que ya están en BigQuery.

¿Entendiste este tema?

Pon a prueba lo que acabas de aprender

Una empresa quiere detectar productos defectuosos en su línea de producción usando imágenes de cámaras. No tienen un equipo de ML pero tienen miles de imágenes etiquetadas (defectuoso/no defectuoso). ¿Qué solución de Google Cloud es más adecuada?