| Código |
15644
|
| Ano |
1
|
| Semestre |
S2
|
| Créditos ECTS |
6
|
| Carga Horária |
PL(30H)/T(30H)
|
| Área Científica |
Informática
|
|
Tipo de ensino |
Presencial
|
|
Estágios |
(Não aplicável)
|
|
Objectivos de Aprendizagem |
A disciplina tem como objetivo introduzir os conceitos fundamentais de Visão Computacional, desde a representação digital de imagens até às arquiteturas modernas baseadas em redes neuronais profundas e modelos generativos. No final da unidade curricular, o estudante deve ser capaz de: a. Compreender os fundamentos de sinais digitais e formação de imagem. b. Aplicar técnicas de extração de características e reconhecimento de objetos. c. Implementar redes neuronais convolucionais e arquiteturas modernas (CNN, Vision Transformer). d. Compreender métodos generativos (GANs) e modelos de visão-linguagem (CLIP). e. Avaliar experimentalmente métodos de Visão Computacional.
|
|
Conteúdos programáticos |
A. Sinais Digitais: Conceitos básicos de imagens digitais; tipos de imagens; conversão analógico-digital; domínio espacial vs frequência; Transformada de Fourier. B. Formação das imagem e Calibração de câmaras. C. Low-level Features: Filtros espaciais e de frequência; algoritmo Canny; deteção de cantos (Harris), pontos de interesse (SIFT); descritores locais e globais. D. Redes Neuronais Convolucionais: Camadas convolucionais, pooling, lineares; funções de ativação; arquiteturas (AlexNet, VGG, ResNet, MobileNet). E. Deteção e reconhecimento de objetos. F. Vision Transformer: Patch encoding; codificador Transformer; camada de classificação. G. Redes Generativas Adversariais: Arquitetura GAN; função de custo; convoluções transpostas. H. Modelos Visão-Linguagem: CLIP; arquitetura; processo de aprendizagem; classificação zero-shot. I. Arquiteturas Modernas: Foundation Models; estratégias de fusão; funções de custo. J. Validação Experimental: Avaliação de desempenho e métricas.
|
|
Metodologias de Ensino e Critérios de Avaliação |
Metodologias de ensino: • Aulas teóricas; • Aulas prático-laboratoriais; • Projetos Individuais; • Tutoria para esclarecimento de dúvidas e acompanhar o aluno no desenvolvimento do seu projeto.
Métodos e Critérios de Avaliação:
As componentes teóricas e práticas são avaliadas recorrendo a dois elementos principais: - uma prova escrita (T) de avaliação de conhecimentos, com um peso de 70% na nota final; - um trabalho prático individual com relatório de execução e apresentação, com peso de 30% na nota final. Classificação Ensino-Aprendizagem (CEA) = 0.7T + 0.3TP Admissão ao exame final: CEA >= 6 valores (regulamento da UBI).
|
|
Bibliografia principal |
Gonzalez, R. C., & Woods, R. E. (2018). Digital Image Processing (4th ed.). Pearson. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. E. R. Davies. Computer Vision: Principles, Algorithms, Applications, Learning. Academic Press, 2018 Szeliski, R. (2022). Computer Vision: Algorithms and Applications Russell, B. & Torralba, A. (2021). Computer Vision: Foundations and Applications.
|
| Língua |
Português
|