Área de concentração: 55134 - Ciências de Computação e Matemática Computacional

Criação: 29/11/2024

Nº de créditos: 12

Carga horária:

Teórica
Por semana
Prática
Por semana
Estudos
Por semana
Duração Total
3 0 9 15 Semanas 180 Horas

Docentes responsáveis:

Agma Juci Machado Traina
Caetano Traina Junior
José Fernando Rodrigues Junior


Objetivos:

Capacitar o aluno de Pós-Graduação a entender as características de cada um dos passos envolvidos, bem como a potencialidades dos métodos utilizados nesses passos, durante o processo de descobrimento de conhecimento em grandes bases de dados (KDD-Knowledge Discovery in Data Bases).


Justificativa:

Aquisição de conhecimento é um dos maiores problemas no desenvolvimento de sistemas inteligentes. Atualmente, devido a diminuição de custos dos dispositivos para armazenar dados e da explosão de novas tecnologias, tais como a Web, grandes volumes de dados encontram-se espalhados na rede. Como o conhecimento pode ser visto como uma abstração ou um nível de informação acima dos dados, esta nova área de pesquisa (KDD) dentro da Computação concentra-se em encontrar métodos e novos algoritmos para extrair conhecimento desses dados. Assim, é importante que o aluno de doutorado conheça os passos envolvidos no processo de KDD e saiba avaliar a pertinência da aplicação de um ou outro método e/ou algoritmo em determinados domínios de conhecimento.


Conteúdo:

Estudo das características e técnicas utilizadas em cada um dos principais passos do processo de KDD, i.e. nos passos de: Seleção,Pré-processamento de dados,Transformação de dados,Mineração de Dados, Interpretação do conhecimento aquirido. Avaliação desse conhecimento. · Modelo computacional Cliente/Servidor, no contexto de grandes bases de dados. · Projeto, aspectos técnicos e de implementação de celeiros de dados. Integração de soluções e benefícios obtidos. Análise do custo/benefício. · Esquemas de Gerenciadores de Bases de Dados para apoiar o processo de tomada de decisão. · Aspectos de mineração de texto em grandes bases de dados. · Estudo de algoritmos de paradigmas diferentes para extrair padrões dos dados. · Algoritmos indutivos que expressam conceitos descobertos na forma de regras if-then. Análise da confiabilidade, qualidade e interesse das regras geradas por esses algoritmos. · Investigação e uso de todos os passos do processo KDD em uma aplicação específica.


Forma de avaliação:

Média dos trabalhos práticos, seminários e às provas realizadas em sala de aula.


Observação:

Nenhuma.


Bibliografia:

Fundamentais:
Martin Kleppmann - ""Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems"", O'Reilly, 2017
Emc Education Services - ""Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data"", 2015
Thudumu, Srikanth, Philip Branch, Jiong Jin, and Jugdutt Singh. ""A comprehensive survey of anomaly detection techniques for high dimensional big data."" Journal of Big Data 7 (2020): 1-30.
Volumes recentes dos periódicos Journal of Data Mining and Knowledge Discovery, Inteligent Data Analisis e Machine Learning. -Proceedings das conferências internacionais de Knowledge Discovery & Data mining.

CONECTE-SE COM A GENTE
 

© 2025 Instituto de Ciências Matemáticas e de Computação