Código |
16683
|
Ano |
3
|
Semestre |
S1
|
Créditos ECTS |
6
|
Carga Horária |
PL(30H)/T(30H)
|
Área Científica |
Informática
|
Objectivos de Aprendizagem |
A disciplina tem como objetivo introduzir os conceitos fundamentais de processamento e análise de imagens e vídeos, cobrindo desde a representação digital até às técnicas modernas baseadas em redes neuronais profundas e modelos generativos. No final da Unidade Curricular o estudante deve ser capaz de: a. Compreender os fundamentos de representação e armazenamento de imagens e vídeo digitais; b. Aplicar técnicas básicas e avançadas de processamento de imagens para melhorar a qualidade e extrair informação relevante; c. Conhecer o funcionamento de métodos de extração de características em imagens; d. Aplicar técnicas de reconhecimento de objetos usando abordagens clássicas e de aprendizagem automática; e. Compreender e utilizar redes neuronais convolucionais para análise de imagens; f. Compreender os princípios dos métodos generativos de imagem, incluindo GANs e modelos de difusão; g. Aplicar arquiteturas baseadas em Transformers para análise e extração de informação de imagens;
|
Conteúdos programáticos |
A. Fundamentos de Imagem e Vídeo: Conceitos básicos de imagens digitais: pixels, resolução, profundidade de cor. Representação e armazenamento: formatos de arquivo, compressão. B. Técnicas de Processamento de Imagem: Transformações básicas: ajuste de brilho/contraste, histograma, normalização. Filtragem espacial e em frequência: suavização, realce, deteção de bordas. Morfologia matemática: dilatação, erosão, abertura, fechamento. C. Técnicas de Análise e Descrição de Imagens: Deteção de características: cantos, bordas, pontos de interesse. Descritores de imagem. Reconhecimento de objetos. D. Redes Neuronais Convolucionais (CNNs). Funcionamento do modelo CNN. Arquiteturas fundamentais para classificação e deteção de objetos. E. Métodos Generativos de Imagem. Introdução aos métodos generativos: discriminativos vs generativos, espaço latente. Redes Generativas Adversariais (GANs). Modelos de Difusão. F. Transformers para Imagens: Modelo Vision Transformer (ViT). Modelos de Visão-Linguagem
|
Metodologias de Ensino e Critérios de Avaliação |
Metodologias de Ensino: • Aulas teóricas; • Aulas prático-laboratoriais; • Projetos Individuais; • Tutoria para esclarecimento de dúvidas e acompanhar o aluno no desenvolvimento do seu projeto.
Métodos e Critérios de Avaliação:
As componentes teóricas e práticas são avaliadas recorrendo a dois elementos principais: - uma prova escrita (T) de avaliação de conhecimentos, com um peso de 70% na nota final; - um trabalho prático individual com relatório de execução e apresentação, com peso de 30% na nota final. Classificação Ensino-Aprendizagem (CEA) = 0.7T + 0.3TP Admissão ao exame final: CEA >= 6 valores (regulamento da UBI).
|
Bibliografia principal |
Gonzalez, R. C., & Woods, R. E. (2018). Digital Image Processing (4th ed.). Pearson. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. O'Shea, K., & Nash, R. (2015). An Introduction to Convolutional Neural Networks. arXiv. Szeliski, R. (2022). Computer Vision: Algorithms and Applications Russell, B. & Torralba, A. (2021). Computer Vision: Foundations and Applications.
|
Língua |
Português
|