| Código |
17978
|
| Ano |
1
|
| Semestre |
S2
|
| Créditos ECTS |
6
|
| Carga Horária |
PL(30H)/T(30H)
|
| Área Científica |
Informática
|
|
Objectivos de Aprendizagem |
Esta unidade curricular (UC) explora os elementos de estado da arte no Processamento de Linguagem Natural (PLN). O objetivo principal é capacitar os estudantes para a aplicação destas tecnologias na resolução de problemas complexos de ciência e engenharia. Os alunos deverão adquirir competências para criar sistemas que incorporam e alavancam modelos de linguagem de larga escala (LLMs). A aprendizagem progride desde os fundamentos clássicos de PLN até ao estudo de arquiteturas modernas e de modelos de larga escala. No final, os estudantes deverão ser capazes de projetar sistemas de recuperação aumentada (RAG), orquestrar recursos por meio de frameworks de referência e desenvolver agentes autónomos baseados em linguagem natural para contextos e problemas específicos.
|
|
Conteúdos programáticos |
1. Introdução e Fundamentais 1.1. Níveis de análise da linguagem humana: léxico, sintático, semântico e pragmático. Desafios e soluções. PLN e Linguística Computacional. 1.2. Recursos clássicos de manipulação da LN (e.g., NLTK e SpaCy). 1.3. Exemplos e aplicações. 2. Semântica Vetorial da LN 2.1. Vetores esparsos (TF-IDF e BoW) e densos (Word2Vec) na LN. 2.2. Vetores densos e contextualizados (e.g., BERT). 2.3. Semântica documental e lexical. 3. Manipulação de Informação com LLMs 3.1. Treino, pós-treino e ajuste-fino de modelos de linguagem de larga escala (LLMs). 3.2. Sistemas de pesquisa e recuperação aumentados (RAG). 3.3. Identificação e extração de informação em texto. 4. Ambientes de Orquestração de Recursos de LN 4.1. Engenharia de prompts. 4.2. As frameworks LangChain e LlamaIndex. 4.3. Sistemas de agentes autónomos baseados em LN. 5. Sistemas de Interação Conversacional 5.1. Alinhamento de modelos e segurança. 5.2. Modos, efetividade e emoções na conversação.
|
|
Metodologias de Ensino e Critérios de Avaliação |
A avaliação por frequência compreende um trabalho distribuído ao longo do semestre, compreendendo a realização de duas provas escritas, (P1 e P2) e dois trabalhos práticos (W1 e W2).
CF = 0.2*P1 + 0.3*P2 + 0.2*W1 + 0.3*W2
A obtenção de CF = 9.50 implica aprovação por frequência e CF < 6.00 implica reprovação, na categoria de “Não Admitido”. A classificação em qualquer exame CE será calculada com base na prova escrita do exame PX e nos trabalhos práticos, nas seguintes proporções:
CE = 0.5*PX + 0.2 W1 + 0.3*W2
|
|
Bibliografia principal |
1. Jurafsky, D. & Martin, J. (2026). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models, 3rd edition. Online manuscript. 2. Bouchard, L. F., & Peters, L. (2024). Building LLMs for production: enhancing LLM abilities and reliability with prompting, fine-tuning, and RAG. Towards AI 3. Oshin, M., & Campos, N. (2025). Learning LangChain. " O'Reilly Media, Inc." 4. Iusztin, M. L. P. (2024). LLM Engineer's Handbook. Packt Publishing. 5. Tunstall, L., Von Werra, L., & Wolf, T. (2022). Natural language processing with transformers. O'Reilly Media.
|
| Língua |
Português
|