Conteúdo / Main content
Menu Rodapé
  1. Início
  2. Cursos
  3. Engenharia Informática
  4. Ciência de Dados

Ciência de Dados

Código 14479
Ano 1
Semestre S2
Créditos ECTS 6
Carga Horária PL(30H)/T(30H)
Área Científica Informática
Objectivos de Aprendizagem Esta UC tem por objetivo introduzir os alunos a tópicos fundamentais da ciência de dados (CD). No final da UC o aluno deverá saber (1) listar os passos envolvidos num projeto de CD e descrever as funções de cada um; (2) conhecer as principais ferramentas de desenvolvimento de um projeto de CD; (3) aplicar métodos de aquisição e obtenção de dados com recurso a pacotes de software python, APIs e web scraping; (4) importar, manipular, transformar, relacionar, analisar e armazenar dados numéricos sob a forma de vetores e de matrizes com recurso ao Numpy; (5) importar, limpar, transformar, manipular, filtrar, agregar, ordenar e analisar dados de forma exploratória com recurso ao Pandas; (6) comunicar resultados através da visualização de dados estáticos e interativos com recurso ao matplotlib, plotly, seaborn e streamlit; (7) entender o que é a IA generativa e saber usar modelos de elevada dimensão;(8) discutir as preocupações éticas associadas à obtenção e ao uso de dados em projetos de CD
Conteúdos programáticos 1. Introdução à Ciência de Dados
2. Ferramentas de desenvolvimento no contexto da Ciência de Dados
3. Aquisição de Dados
4. Manipulação e Análise de Dados Numéricos com Numpy
5. Manipulação e Análise de Dados com Pandas Dataframes
6. Visualização de Dados Estáticos e Interativos com recurso ao Matplotlib, Plotly, Seaborn e Streamlit
7. Introdução aos Modelos de Linguagem de Grande Dimensão (LLMs) para Processamento da Linguagem Natural (PLN)
8. Ética e Privacidade na Ciência de Dados
Metodologias de Ensino e Critérios de Avaliação Assiduidade (A)
A aprovação à disciplina está condicionada a níveis mínimos de assiduidade de 80% nas aulas.
Trabalho Prático (P)
Os trabalhos práticos da disciplina contribuem em 10 valores para a classificação final.
A aprovação à disciplina requer a nota mínima de 5 valores no trabalho prático.
Parte 1: Data Science Use Case: In-depth Report and Presentation (3 valores): 26 de Março de 2021, 23:59, via email. (Grupos de até 4 elementos)
Parte 2: Data Science Hands-On Project: Supermarket Analysis (7 valores): 28 de Maio de 2021, 23:59, via email. (Individual)
A obtenção de classificação nos trabalhos práticos está condicionada à apresentação/discussão individual de cada aluno com o docente.
Frequência
Prova (F1) - 6ª feira, 4 de junho de 2021, 14:00-16:00, Sala 6.17
Classificação Ensino/Aprendizagem (C)
C=P1*3/20+P2*7/20+F*10/20
Admissão a Exame
Consideram-se admitidos a Exame os alunos que obtiverem classificação mínima de 6 valores na componente de Ensino-Aprendizagem.
Exames
Bibliografia principal - Abha Belorkar, Sharath Guntuku, Shubhangi Hora, Anshu Kumar (2020). Interactive Data Visualization with Python. 2nd edition. Packt Publishing.
- Foster Provost, Tom Fawcett (2013). Data Science for Business. O'Reilly
- Jake VanderPlas (2017). Python Data Science Handbook. O’Reilly
- Mike Loukides, Hilary Mason, DJ Patil (2018). Ethics and Data Science. O'Reilly
- Stefanie Molin (2019). Hands-On Data Analysis with Pandas: Efficiently perform data collection, wrangling, analysis, and visualization using Python. Packt Publishing.
- Steve Blair (2019). Python Data Science: The Ultimate Handbook for Beginners on How to Explore NumPy for Numerical Data, Pandas for Data Analysis, IPython, Scikit-Learn and Tensorflow for Machine Learning and Business
- Wes McKinney (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O´Reilly
- Daniel Gomes, Elena Demidova, Jane Winters, Thomas Risse (2021). The Past Web: Exploring Web Archives. Springer
Língua Português
Data da última atualização: 2024-02-07
As cookies utilizadas neste sítio web não recolhem informação pessoal que permitam a sua identificação. Ao continuar está a aceitar a política de cookies.