Conteúdo / Main content
Menu Rodapé
  1. Início
  2. Cursos
  3. Matemática e Aplicações
  4. Ciência de Dados

Ciência de Dados

Código 15643
Ano 1
Semestre S2
Créditos ECTS 6
Carga Horária PL(30H)/T(30H)
Área Científica Informática
Objectivos de Aprendizagem Esta UC tem por objetivo introduzir os alunos a tópicos fundamentais da ciência de dados (CD). No final da UC o aluno deverá saber (1) listar os passos envolvidos num projeto de CD e descrever as funções de cada um; (2) conhecer as principais ferramentas de desenvolvimento de um projeto de CD; (3) aplicar métodos de aquisição e obtenção de dados com recurso a pacotes de software python, APIs e web scraping; (4) importar, manipular, transformar, relacionar, analisar e armazenar dados numéricos sob a forma de vetores e de matrizes com recurso ao Numpy; (5) importar, limpar, transformar, manipular, filtrar, agregar, ordenar e analisar dados de forma exploratória com recurso ao Pandas; (6) comunicar resultados através da visualização de dados estáticos e interativos com recurso ao matplotlib, plotly, seaborn e streamlit; (7) entender o que é a IA generativa e saber usar modelos de elevada dimensão; (8) discutir as preocupações éticas, de privacidade e transparência em projetos de CD
Conteúdos programáticos 1. Introdução à Ciência de Dados
2. Ferramentas de desenvolvimento no contexto da Ciência de Dados
3. Aquisição de Dados
4. Manipulação e Análise de Dados Numéricos com Numpy
5. Manipulação e Análise de Dados com Pandas Dataframes
6. Visualização de Dados Estáticos e Interativos com recurso ao Matplotlib, Plotly, Seaborn e Streamlit
7. Introdução aos Modelos de Linguagem de Grande Dimensão (LLMs) para Processamento da Linguagem Natural (PLN)
8. Ética e Privacidade na Ciência de Dados
Metodologias de Ensino e Critérios de Avaliação Avaliação Ensino/Aprendizagem
- Projeto I (individual): 15%
- Projeto II (grupos de 3 elementos): 35%
- Frequência: 50%

A classificação final da UC resulta da média ponderada das classificações obtidas nas componentes de avaliação definidas. O aluno obtém aprovação à UC, estando dispensado de Exame, no caso de obter uma nota igual ou superior a 9.5 valores.

Avaliação por Exame
- Exame (100%)

Requisitos de admissibilidade à frequência e ao exame:
- A aprovação à UC pressupõe um mínimo de 70% de assiduidade às aulas durante o período de ensino-aprendizagem (exceto trabalhadores estudantes). As presenças em aula não são classificadas com nota nem contam para avaliação, constituem, no entanto, condição necessária para aprovação à UC por frequência e exame. O incumprimento deste item impede o aluno de se submeter à frequência e ao exame.
- A aprovação à UC requer uma nota mínima de 6 valores em cada um dos dois projetos, condicionada à apresentação/discussão de cada aluno com o docente.
Bibliografia principal - Belorkar, A., Guntuku, S., Hora, S. & Kumar, A. (2020). Interactive Data Visualization with Python.
- Provost, F. & Fawcett, T. (2013). Data Science for Business.
- VanderPlas, J. (2017). Python Data Science Handbook.
- Loukides, M., Mason, H. & Patil, D. (2018). Ethics and Data Science.
- Molin, S. (2019). Hands-On Data Analysis with Pandas: Efficiently perform data collection, wrangling, analysis, and visualization using Python.
- Blair, S. (2019). Python Data Science: The Ultimate Handbook for Beginners on How to Explore NumPy for Numerical Data, Pandas for Data Analysis, IPython, Scikit-Learn and Tensorflow for Machine Learning and Business
- McKinney, W. (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython.
- Gomes, D., Demidova, E., Winters, J. & Risse, T. (2021). The Past Web: Exploring Web Archives.
- Alammar, J. & Grootendorst, M. (2024). Hands-On Large Language Models.
- Rodriguez, C. (2024). Generative AI. Foundations in Python.
Língua Português
Data da última atualização: 2025-02-28
As cookies utilizadas neste sítio web não recolhem informação pessoal que permitam a sua identificação. Ao continuar está a aceitar a política de cookies.