Curso Técnico Superior Profissional

Robótica e Inteligência Artificial

Área Científica

481 - Ciências Informáticas

Duração

Semestral

Unidade Curricular

Ciência de Dados

ECTS

3

Horas de Contacto Teórico Práticas

80h ( TP 80h )

Objetivos da Aprendizagem

1) Compreender os conceitos fundamentais da ciência de dados
2) Entender os processos de recolha, limpeza e armazenamento de dados
3) Desenvolver habilidades básicas em análise exploratória de dados
4) Executar e controlar projetos de Ciência dos Dados
5) Compreender a importância da informação nos processos de tomada de decisão
6) Desenvolver a capacidade de extrair conhecimento de diversos conjuntos de dados
7) Desenvolver de forma autónoma sentido crítico para escolher a melhor abordagem para endereçar soluções para problemas que envolvam preparação de dados, modelação e avaliação dos resultados

Conteúdos Programáticos

1. Introdução à Ciência de Dados

1.1. Definição de Ciência de Dados
1.2. História e evolução da Ciência de Dados
1.3. Aplicações da Ciência de Dados em diferentes áreas

2. Processos de Recolha e Armazenamento de Dados

2.1. Tipos de dados
2.2. Fontes de dados
2.3. Processos de Recolha de dados
2.4. Processos de armazenamento de dados

3. Limpeza e Preparação de Dados

3.1. Identificação de dados inconsistentes e em falta
3.2. Tratamento de dados inconsistentes e em falta
3.3. Normalização de dados

4. Aplicações de Business Intelligence & Analytics

4.1. Processamento analítico online (OLAP)
4.2. Data Warehouse (DW) e Data Mart
4.3. Data Mining

4.3.1. O processo de data Mining
4.3.2. CRISP-DM (Cross-Industry Standard Processs for Data Mining)
4.3.3. Outras tecnologias de Data Mining
4.3.4. Técnicas de Data Mining

5. Modelação e avaliação de dados

5.1. Aprendizagem supervisionado e não supervisionado.
5.2. Modelos lineares e não lineares
5.3. Regressão linear
5.4. Árvores de decisão
5.5. Florestas aleatórias
5.6. Redes neurais
5.7. Segmentação ou Agrupamento
5.8. Avaliação de modelos, incluindo validação cruzada e matriz de confusão

6. Comunicação de Resultados

6.1. Visualização de resultados, incluindo gráficos de barras, gráficos de dispersão e mapas de calor
6.2. Ferramentas de visualização de dados (PowerBI, entre outras)
6.3. Relatórios de dados, incluindo relatórios executivos e apresentações de slides

Bibliografia e recursos didáticos recomendados

• Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly Media, Inc.
• Sharda, R., Delen, D., Turban, E., Aronson, J., & Liang, T. P. (2014). Business Intelligence and Analytics: Systems for Decision Support. Prentice Hall.
• Sharda, R.; Delen, D.; Turban, E. (2017). Business Intelligence, Analytics and Data Science: A Managerial Perspective. Pearson
• Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0 Step-by-step data mining guide.
• Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
• George, N. (2021). Practical Data Science with Python: Learn tools and techniques from hands-on examples to extract insights from data. Packt
• Grus, J. (2019). Data Science from Scratch: First Principles with Python. O’Reilly Media, Inc.