Menu Conteúdo Rodapé
  1. Início
  2. Cursos
  3. Engenharia Informática
  4. Ciência de Dados

Ciência de Dados

Código 14479
Ano 1
Semestre S2
Créditos ECTS 6
Carga Horária PL(30H)/T(30H)
Área Científica Informática
Objectivos de Aprendizagem O objetivo desta unidade curricular é a tramissão de processos de tomada de decisão, com base na análise de dados. Análise da emergência da ciência dos dados em função das grandes quantidades de informação e das redes sociais, do desenvolvimento de dispositivos de computação de alto desempenho, bem como a emergência de métodos poderosos de modelação baseados em aprendizagem profunda. Assim, este curso transmite um conjunto de principios, definições de problemas, algoritmos e processos para extrair padrões não óbvios e uteis a partir de conjuntos de dados de elevada dimensão. Neste sentido, pode ser entendido como intimamente ligado aos domínios da mineração de dados e da aprendizagem automática, num espectro mais lato.
Conteúdos programáticos O que é a ciência de dados? Infraestrutura de Dados: desafios devido a volume, heterogeneidade e inconsistências
- Fundamentos de Ciência de Dados: Análise exploratória, Extração de características e modelação
- Codificação de dados e formatos de ficheiros
- bases de Dados relacionais e dados não estruturados
- Visualização de dados e sumariarão
- Gráficos de barras, "pie", histogramas, box plots, e mapas de calor
- Redução de dimensionalidade
- Rotação de eixos (PCA)
- Tipos de transformações (ondulas e análise espectral)
-Distribuições de probabilidade
- Anscombe’s Quartet;
- Big Data
- Hadoop, HDFS, PySpark;
- paradigma MapReduce;
- Modelos Frequent Pattern Mining;
- Análise Outliers;
- Meta-Algoritmos;
- Mineração de dados Web
- Engenharia de Software e desempenho computacional
- desenho CRAP;
- estruturas de Dados
- desempenho amortizado e médio
Metodologias de Ensino e Critérios de Avaliação Assiduidade (A)
A aprovação à disciplina está condicionada a níveis mínimos de assiduidade de 80% nas aulas.
Trabalho Prático (P)
Os trabalhos práticos da disciplina contribuem em 10 valores para a classificação final.
A aprovação à disciplina requer a nota mínima de 5 valores no trabalho prático.
Parte 1: Data Science Use Case: In-depth Report and Presentation (3 valores): 26 de Março de 2021, 23:59, via email. (Grupos de até 4 elementos)
Parte 2: Data Science Hands-On Project: Supermarket Analysis (7 valores): 28 de Maio de 2021, 23:59, via email. (Individual)
A obtenção de classificação nos trabalhos práticos está condicionada à apresentação/discussão individual de cada aluno com o docente.
Frequência
Prova (F1) - 6ª feira, 4 de junho de 2021, 14:00-16:00, Sala 6.17
Classificação Ensino/Aprendizagem (C)
C=P1*3/20+P2*7/20+F*10/20
Admissão a Exame
Consideram-se admitidos a Exame os alunos que obtiverem classificação mínima de 6 valores na componente de Ensino-Aprendizagem.
Exames
Bibliografia principal - C. Aggarwal. Data Mining: the textbook. Springer, ISBN: 9783319141411, 2015.
- John Kelleger. Data Science. MIT Press Essential Knowledge Series, ISBN: 0262535432,
2018.
- Field Cady. The Data Science Handbook. Wiley, ISBN: 1119092949, 2017.
Língua Português
Data da última atualização: 2022-06-17
As cookies utilizadas neste sítio web não recolhem informação pessoal que permitam a sua identificação. Ao continuar está a aceitar a política de cookies.