Procesamiento de lenguaje natural:
de fundamentos a aplicaciones prácticas
Aprende a construir sistemas que entienden, analizan y generan texto humano usando técnicas modernas de NLP y aprendizaje automático.
Lo que aprenderás durante el programa
Este programa cubre desde tokenización básica hasta modelos de lenguaje complejos. Trabajarás con datos reales, implementarás algoritmos desde cero y usarás bibliotecas estándar como spaCy y Transformers.
Fundamentos de NLP y preprocesamiento
Domina las técnicas esenciales para preparar texto antes de cualquier análisis: tokenización, normalización y eliminación de ruido. Entenderás cómo funcionan diferentes estrategias según el idioma.
Vectorización y representación semántica
Aprende cómo convertir texto en números que capturen significado. Desde técnicas clásicas como TF-IDF hasta embeddings contextuales modernos que cambian según el uso de cada palabra.
Análisis de sentimiento y clasificación
Construye clasificadores que detectan opiniones, emociones y temas en texto. Compararás modelos tradicionales con redes neuronales para ver qué funciona mejor según el caso.
Extracción de información y NER
Identifica entidades (personas, lugares, organizaciones) y relaciones en texto no estructurado. Aprenderás técnicas basadas en reglas y enfoques estadísticos más robustos.
Modelos generativos y traducción
Crea sistemas que producen texto coherente: resúmenes automáticos, chatbots y traducción entre idiomas. Usarás arquitecturas seq2seq y modelos transformer de última generación.
Dr. Adrià Fontanals
Investigador en NLP
Trabaja en modelos de lenguaje multilingües y ha publicado sobre arquitecturas transformer optimizadas para idiomas con pocos recursos.
Dra. Elisenda Pujol
Ingeniera de ML aplicado
Especialista en sistemas de producción de NLP, con experiencia en análisis de sentimiento a escala y extracción de información de documentos técnicos.
Míriam Castells
Arquitecta de NLP
Diseña pipelines de procesamiento de lenguaje para aplicaciones comerciales y ha implementado chatbots conversacionales basados en modelos generativos.
Empieza a construir sistemas que entienden lenguaje
Las plazas están abiertas. El programa incluye proyectos prácticos, acceso a datasets reales y soporte técnico durante todo el curso.
Solicita informaciónFormato y requisitos del programa
Duración y dedicación
12 semanas con clases dos veces por semana. Necesitarás entre 8-10 horas semanales para ejercicios y proyectos fuera de las sesiones en vivo.
Conocimientos previos
Python intermedio, comprensión básica de álgebra lineal y experiencia con NumPy. Es útil conocer conceptos de machine learning pero no es obligatorio.
Materiales incluidos
Notebooks de Jupyter con código completo, datasets etiquetados para práctica, grabaciones de todas las sesiones y repositorio de GitHub con soluciones comentadas.
Proyecto final
Construirás un sistema completo de NLP de tu elección: clasificador de documentos, chatbot, sistema de extracción de información o traductor automático.