Área de concentração: 55134 - Ciências de Computação e Matemática Computacional

Criação: 07/12/2023

Nº de créditos: 6

Carga horária:

Teórica
Por semana
Prática
Por semana
Estudos
Por semana
Duração Total
3 3 9 6 Semanas 90 Horas

Docentes responsáveis:

Alexandre Cláudio Botazzo Delbem
Cláudio Fabiano Motta Toledo


Objetivos:

Introduzir técnicas de mineração de dados avançadas que possibilitam a determinação automática de correlações a partir de qualquer tipo de dado para construção de modelos probabilísticos, que podem ser utilizados para métodos de classificação e para projeto de algoritmos de otimização baseados em
modelos.


Justificativa:

O agrupamento de dados é adequado para se verificar semelhanças, correlações ou homologia a partir de dados de diversas áreas, principalmente, em uma área relativamente nova, sem modelos descrevendo o sistema em estudo. Algumas técnicas recentes de mineração de dados têm possibilitado analisar conjuntos de amostras envolvendo tipos de dados considerados complexos, como por exemplo, espectros, sinais, imagens, planilhas, textos, códigos de computador, etc., que podem conter tanto pequena quanto grande quantidade de amostras. A partir de análises geradas por tais técnicas, pode-se construir modelos probabilísticos descrevendo o sistema em estudo e, então, utilizá-los para tarefas de classificação ou para construção de algoritmos de otimização baseados nesses modelos, que têm sido denominados de Algoritmos de Estimação de Distribuição.


Conteúdo:

Introdução de técnicas de agrupamento e classificação para casos com p<<n, em que p é o número de amostras e n é o número de características de cada amostra. Comparação de amostras baseada em compressão de dados. Mineração de Dados de Repositório de Códigos. Descoberta de novidade baseada em agrupamento por compressão. Análise de agrupamentos hierárquicos: detecção de comunidades, seleção de grupos por fronteira de Pareto e ambiguidade de árvore. Projeto de algoritmos de estimação de distribuição a partir de modelos probabilísticos gerados por mineração de dados complexos. Estudos de casos de aplicações dessas técnicas em problemas de engenharia, bionformática, agricultura e logística.


Forma de avaliação:

Provas e projetos.


Observação:

Nenhuma.


Bibliografia:

Bibliografia fundamental

Hastie, T., Tibshirani, R., Friedman, J.. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Second Edition, 2009.
Newman, M.. Networks: An Introduction, Oxford University Press, 2010.

Bibiografia complementar

Gaspar-Cunha, António ; Costa, Paulo ; Monaco, Francisco ; Delbem, Alexandre. Many-Objectives Optimization: A Machine Learning Approach for Reducing the Number of Objectives. Mathematical And Computational Applications, v. 28, p. 17, 2023.

Gaspar-Cunha, António ; Costa, P. ; Delbem, A.C.B. ; Monaco, Francisco ; Ferreira, M. J. ; Covas, J. . Evolutionary Multi-Objective Optimization of Extrusion Barrier Screws: Data Mining and Decision Making. Polymers, v. 1, p. 1-24, 2023.

Gholi Zadeh Kharrat, Fatemeh ; Shydeo Brandão Miyoshi, Newton ; Cobre, Juliana ; Mazzoncini De Azevedo-Marques, João ; Mazzoncini De Azevedo-Marques, Paulo ; Cláudio Botazzo Delbem, Alexandre. Feature sensitivity criterion-based sampling strategy from the Optimization based on Phylogram Analysis (Fs-OPA) and Cox regression applied to mental disorder datasets. PLoS One, v. 15, p. e0235147, 2020.

Silva, B. D. A. Cuminato, L. A. , Delbem, A. C. B., Diniz, P. C., Bonato, V.. Application-oriented cache memory configuration for energy, IET Computers Digital Techniques, No. 1, Vol. 9, 2015, 73-81.

Martins, Luiz G. A., Nobre, R., Cardoso, J. M. P, Delbem, A.C. B., Marques, E.. Clustering-Based Selection for the Exploration of Compiler Optimization Sequences, ACM Trans. Archit. Code Optim., No. 1, Vol.13, 2016, 1-28.

Moro, L. F. S. ; Lopes, A. M. Z. ; Delbem, A. C. B. ; Isotani, S. Os Desafios para Minerar Dados Educacionais de Forma Rápida e Intuitiva: o Caso da DAMICORE e a Caracterização de Alunos em Ambientes de eLearning.. In: II Workshop de Desafios da Computação Aplicada à Educação, 2013, Maceio. XXXIII Congresso da Sociedade Brasileira de Computação, 2013. p. 1-10.

Moro, L. F. ; Rodriguez, C. L. ; Andrade, F. R. H. ; Delbem, A. C. B. Isotani, S. . Caracterização de Alunos em Ambientes de Ensino Online. In: Workshop de Mineração de Dados em Ambientes Virtuais do Ensino/Aprendizagem, 2014, Dourados. Anais do Congresso Brasileiro de Informática na Educação, 2014. p. 1-10.

Silva, B. A. ; Delbem, A. C. B. ; Deniz, P. C. ; Bonato, Vanderlei . Runtime Mapping and Scheduling for Energy Efficiency in Heterogeneous Multi-Core Systems. In: International Conference on Reconfigurable Computing and FPGAs, 2015, Mayan Riviera. 2015 International Conference on Reconfigurable Computing and FPGAs, 2015. p. 1-6.

L. G. A. Martins, R. Nobre, A. C. B. Delbem, E. Marques and J. M. P. Cardoso, "A clustering-based approach for exploring sequences of compiler optimizations," 2014 IEEE Congress on Evolutionary Computation (CEC), Beijing, 2014, pp. 2436-2443.

Martinz, L. G.A. ; Nonbre, R. ; Delbem, A. C.B. ; Marques, E. ; CARDOSO, J.M.P. . Exploration of compiler optimization sequences using clustering-based selection. In: the 2014 SIGPLAN/SIGBED conference, 2014, Edinburgh. Proceedings of the 2014 SIGPLAN/SIGBED conference on Languages, compilers and tools for embedded systems - LCTES '14, 2014. p. 63.

Cilibrasi, R., Vitányi, P.. Clustering by compression, IEEE Trans. On Information Theory, vol. 51, No. 4,2005, 1523–1545.

Felsenstein, J.. Inferring phylogenies. : Sinauer Associates, 2003.

CONECTE-SE COM A GENTE
 

© 2024 Instituto de Ciências Matemáticas e de Computação