Form Ulmar - Educación transnacional en procesamiento de lenguaje natural

Procesamiento de lenguaje natural:
de fundamentos a aplicaciones prácticas

Aprende a construir sistemas que entienden, analizan y generan texto humano usando técnicas modernas de NLP y aprendizaje automático.

Espacio de trabajo con código de procesamiento de lenguaje natural

Lo que aprenderás durante el programa

Este programa cubre desde tokenización básica hasta modelos de lenguaje complejos. Trabajarás con datos reales, implementarás algoritmos desde cero y usarás bibliotecas estándar como spaCy y Transformers.

1

Fundamentos de NLP y preprocesamiento

Domina las técnicas esenciales para preparar texto antes de cualquier análisis: tokenización, normalización y eliminación de ruido. Entenderás cómo funcionan diferentes estrategias según el idioma.

Tokenización a nivel de palabra y subpalabra (BPE, WordPiece)
Stemming y lemmatización con comparación de rendimiento
Manejo de idiomas con morfología compleja
2

Vectorización y representación semántica

Aprende cómo convertir texto en números que capturen significado. Desde técnicas clásicas como TF-IDF hasta embeddings contextuales modernos que cambian según el uso de cada palabra.

Bag-of-words y TF-IDF con optimización de memoria
Word2Vec y GloVe: entrenamiento y uso de vectores preentrenados
Embeddings contextuales con BERT y comparación con estáticos
3

Análisis de sentimiento y clasificación

Construye clasificadores que detectan opiniones, emociones y temas en texto. Compararás modelos tradicionales con redes neuronales para ver qué funciona mejor según el caso.

Clasificadores clásicos: Naive Bayes, SVM y regresión logística
Redes neuronales recurrentes (LSTM, GRU) para secuencias
Fine-tuning de modelos transformer para clasificación específica
4

Extracción de información y NER

Identifica entidades (personas, lugares, organizaciones) y relaciones en texto no estructurado. Aprenderás técnicas basadas en reglas y enfoques estadísticos más robustos.

Named Entity Recognition con CRF y BiLSTM-CRF
Extracción de relaciones mediante patrones y dependencias sintácticas
Creación de datasets personalizados y anotación eficiente
5

Modelos generativos y traducción

Crea sistemas que producen texto coherente: resúmenes automáticos, chatbots y traducción entre idiomas. Usarás arquitecturas seq2seq y modelos transformer de última generación.

Encoder-decoder con mecanismos de atención
GPT y T5 para generación y summarización
Evaluación de calidad: BLEU, ROUGE y métricas modernas
Instructor especializado en NLP

Dr. Adrià Fontanals

Investigador en NLP

Trabaja en modelos de lenguaje multilingües y ha publicado sobre arquitecturas transformer optimizadas para idiomas con pocos recursos.

Experta en procesamiento de texto

Dra. Elisenda Pujol

Ingeniera de ML aplicado

Especialista en sistemas de producción de NLP, con experiencia en análisis de sentimiento a escala y extracción de información de documentos técnicos.

Desarrolladora de sistemas NLP

Míriam Castells

Arquitecta de NLP

Diseña pipelines de procesamiento de lenguaje para aplicaciones comerciales y ha implementado chatbots conversacionales basados en modelos generativos.

Empieza a construir sistemas que entienden lenguaje

Las plazas están abiertas. El programa incluye proyectos prácticos, acceso a datasets reales y soporte técnico durante todo el curso.

Solicita información

Formato y requisitos del programa

Duración y dedicación

12 semanas con clases dos veces por semana. Necesitarás entre 8-10 horas semanales para ejercicios y proyectos fuera de las sesiones en vivo.

Conocimientos previos

Python intermedio, comprensión básica de álgebra lineal y experiencia con NumPy. Es útil conocer conceptos de machine learning pero no es obligatorio.

Materiales incluidos

Notebooks de Jupyter con código completo, datasets etiquetados para práctica, grabaciones de todas las sesiones y repositorio de GitHub con soluciones comentadas.

Proyecto final

Construirás un sistema completo de NLP de tu elección: clasificador de documentos, chatbot, sistema de extracción de información o traductor automático.

Sesión práctica de programación NLP

Utilizamos cookies para mejorar tu experiencia en nuestro sitio. Al continuar navegando, aceptas nuestra política de cookies.