Curso Técnico Superior Profissional
Robótica e Inteligência Artificial
Área Científica
481 - Ciências Informáticas
Duração
Semestral
Unidade Curricular
Ciência de Dados
ECTS
3
Horas de Contacto Teórico Práticas
80h ( TP 80h )
Objetivos da Aprendizagem
1) Compreender os conceitos fundamentais da ciência de dados
2) Entender os processos de recolha, limpeza e armazenamento de dados
3) Desenvolver habilidades básicas em análise exploratória de dados
4) Executar e controlar projetos de Ciência dos Dados
5) Compreender a importância da informação nos processos de tomada de decisão
6) Desenvolver a capacidade de extrair conhecimento de diversos conjuntos de dados
7) Desenvolver de forma autónoma sentido crítico para escolher a melhor abordagem para endereçar soluções para problemas que envolvam preparação de dados, modelação e avaliação dos resultados
Conteúdos Programáticos
1. Introdução à Ciência de Dados
1.1. Definição de Ciência de Dados
1.2. História e evolução da Ciência de Dados
1.3. Aplicações da Ciência de Dados em diferentes áreas
2. Processos de Recolha e Armazenamento de Dados
2.1. Tipos de dados
2.2. Fontes de dados
2.3. Processos de Recolha de dados
2.4. Processos de armazenamento de dados
3. Limpeza e Preparação de Dados
3.1. Identificação de dados inconsistentes e em falta
3.2. Tratamento de dados inconsistentes e em falta
3.3. Normalização de dados
4. Aplicações de Business Intelligence & Analytics
4.1. Processamento analítico online (OLAP)
4.2. Data Warehouse (DW) e Data Mart
4.3. Data Mining
4.3.1. O processo de data Mining
4.3.2. CRISP-DM (Cross-Industry Standard Processs for Data Mining)
4.3.3. Outras tecnologias de Data Mining
4.3.4. Técnicas de Data Mining
5. Modelação e avaliação de dados
5.1. Aprendizagem supervisionado e não supervisionado.
5.2. Modelos lineares e não lineares
5.3. Regressão linear
5.4. Árvores de decisão
5.5. Florestas aleatórias
5.6. Redes neurais
5.7. Segmentação ou Agrupamento
5.8. Avaliação de modelos, incluindo validação cruzada e matriz de confusão
6. Comunicação de Resultados
6.1. Visualização de resultados, incluindo gráficos de barras, gráficos de dispersão e mapas de calor
6.2. Ferramentas de visualização de dados (PowerBI, entre outras)
6.3. Relatórios de dados, incluindo relatórios executivos e apresentações de slides
Bibliografia e recursos didáticos recomendados
• Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. O’Reilly Media, Inc.
• Sharda, R., Delen, D., Turban, E., Aronson, J., & Liang, T. P. (2014). Business Intelligence and Analytics: Systems for Decision Support. Prentice Hall.
• Sharda, R.; Delen, D.; Turban, E. (2017). Business Intelligence, Analytics and Data Science: A Managerial Perspective. Pearson
• Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0 Step-by-step data mining guide.
• Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann.
• George, N. (2021). Practical Data Science with Python: Learn tools and techniques from hands-on examples to extract insights from data. Packt
• Grus, J. (2019). Data Science from Scratch: First Principles with Python. O’Reilly Media, Inc.