Área de concentração: 55134 - Ciências de Computação e Matemática Computacional
Criação: 29/11/2024
Nº de créditos: 12
Carga horária:
Teórica Por semana |
Prática Por semana |
Estudos Por semana |
Duração | Total |
3 | 0 | 9 | 15 Semanas | 180 Horas |
Docentes responsáveis:
Agma Juci Machado Traina
Caetano Traina Junior
José Fernando Rodrigues Junior
Objetivos:
Capacitar o aluno de Pós-Graduação a entender as características de cada um dos passos envolvidos, bem como a potencialidades dos métodos utilizados nesses passos, durante o processo de descobrimento de conhecimento em grandes bases de dados (KDD-Knowledge Discovery in Data Bases).
Justificativa:
Aquisição de conhecimento é um dos maiores problemas no desenvolvimento de sistemas inteligentes. Atualmente, devido a diminuição de custos dos dispositivos para armazenar dados e da explosão de novas tecnologias, tais como a Web, grandes volumes de dados encontram-se espalhados na rede. Como o conhecimento pode ser visto como uma abstração ou um nível de informação acima dos dados, esta nova área de pesquisa (KDD) dentro da Computação concentra-se em encontrar métodos e novos algoritmos para extrair conhecimento desses dados. Assim, é importante que o aluno de doutorado conheça os passos envolvidos no processo de KDD e saiba avaliar a pertinência da aplicação de um ou outro método e/ou algoritmo em determinados domínios de conhecimento.
Conteúdo:
Estudo das características e técnicas utilizadas em cada um dos principais passos do processo de KDD, i.e. nos passos de: Seleção,Pré-processamento de dados,Transformação de dados,Mineração de Dados, Interpretação do conhecimento aquirido. Avaliação desse conhecimento. · Modelo computacional Cliente/Servidor, no contexto de grandes bases de dados. · Projeto, aspectos técnicos e de implementação de celeiros de dados. Integração de soluções e benefícios obtidos. Análise do custo/benefício. · Esquemas de Gerenciadores de Bases de Dados para apoiar o processo de tomada de decisão. · Aspectos de mineração de texto em grandes bases de dados. · Estudo de algoritmos de paradigmas diferentes para extrair padrões dos dados. · Algoritmos indutivos que expressam conceitos descobertos na forma de regras if-then. Análise da confiabilidade, qualidade e interesse das regras geradas por esses algoritmos. · Investigação e uso de todos os passos do processo KDD em uma aplicação específica.
Forma de avaliação:
Média dos trabalhos práticos, seminários e às provas realizadas em sala de aula.
Observação:
Nenhuma.
Bibliografia:
Fundamentais:
Martin Kleppmann - ""Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems"", O'Reilly, 2017
Emc Education Services - ""Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data"", 2015
Thudumu, Srikanth, Philip Branch, Jiong Jin, and Jugdutt Singh. ""A comprehensive survey of anomaly detection techniques for high dimensional big data."" Journal of Big Data 7 (2020): 1-30.
Volumes recentes dos periódicos Journal of Data Mining and Knowledge Discovery, Inteligent Data Analisis e Machine Learning. -Proceedings das conferências internacionais de Knowledge Discovery & Data mining.
© 2025 Instituto de Ciências Matemáticas e de Computação