Código |
15643
|
Ano |
1
|
Semestre |
S2
|
Créditos ECTS |
6
|
Carga Horária |
PL(30H)/T(30H)
|
Área Científica |
Informática
|
Objectivos de Aprendizagem |
Esta UC tem por objetivo introduzir os alunos a tópicos fundamentais da ciência de dados (CD). No final da UC o aluno deverá saber (1) listar os passos envolvidos num projeto de CD e descrever as funções de cada um; (2) conhecer as principais ferramentas de desenvolvimento de um projeto de CD; (3) aplicar métodos de aquisição e obtenção de dados com recurso a pacotes de software python, APIs e web scraping; (4) importar, manipular, transformar, relacionar, analisar e armazenar dados numéricos sob a forma de vetores e de matrizes com recurso ao Numpy; (5) importar, limpar, transformar, manipular, filtrar, agregar, ordenar e analisar dados de forma exploratória com recurso ao Pandas; (6) comunicar resultados através da visualização de dados estáticos e interativos com recurso ao matplotlib, plotly, seaborn e streamlit; (7) saber usar modelos de elevada dimensão; (8) discutir as preocupações éticas e de privacidade associadas à obtenção, uso e manipulação de dados em projetos de CD;
|
Conteúdos programáticos |
1. Introdução à Ciência de Dados 2. Ferramentas de desenvolvimento no contexto da Ciência de Dados 3. Aquisição de Dados 4. Manipulação e Análise de Dados Numéricos com Numpy 5. Manipulação e Análise de Dados com Pandas Dataframes 6. Visualização de Dados Estáticos e Interativos com recurso ao Matplotlib, Plotly, Seaborn e Streamlit 7. Introdução aos Modelos de Linguagem de Grande Dimensão (LLMs) para Processamento da Linguagem Natural (PLN) 8. Ética e Privacidade na Ciência de Dados
|
Metodologias de Ensino e Critérios de Avaliação |
Avaliação Ensino/Aprendizagem - Frequência: 50% (prova individual realizada em computador com consulta parcial dos conteúdos) - Projeto: 50% (grupos de 3 elementos)
Avaliação por Exame - Exame: 100% (prova realizada em computador sem consulta)
|
Bibliografia principal |
- Belorkar, A., Guntuku, S., Hora, S. & Kumar, A. (2020). Interactive Data Visualization with Python. - Provost, F. & Fawcett, T. (2013). Data Science for Business. - VanderPlas, J. (2017). Python Data Science Handbook. - Loukides, M., Mason, H. & Patil, D. (2018). Ethics and Data Science. - Molin, S. (2019). Hands-On Data Analysis with Pandas: Efficiently perform data collection, wrangling, analysis, and visualization using Python. - Blair, S. (2019). Python Data Science: The Ultimate Handbook for Beginners on How to Explore NumPy for Numerical Data, Pandas for Data Analysis, IPython, Scikit-Learn and Tensorflow for Machine Learning and Business - McKinney, W. (2017). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. - Alammar, J. & Grootendorst, M. (2024). Hands-On Large Language Models. - Rodriguez, C. (2024). Generative AI. Foundations in Python. - Raschka, S. (2024). Build a Large Languade Model (From Scratch). Manning
|
Língua |
Português
|