Área de concentração: 55134 - Ciências de Computação e Matemática Computacional

Criação: 25/06/2024

Nº de créditos: 12

Carga horária:

Teórica
Por semana
Prática
Por semana
Estudos
Por semana
Duração Total
3 0 9 15 Semanas 180 Horas

Docentes responsáveis:

Agma Juci Machado Traina
Caetano Traina Junior
Elaine Parros Machado de Sousa
José Fernando Rodrigues Junior


Objetivos:

Apresentar ao aluno uma visão aprofundada da arquitetura e de técnicas de construção de gerenciadores de objetos complexos, envolvendo conceitos de recuperação de dados por similaridade, explorando tanto a busca em conjuntos de dados isolados quanto de dados representados em relações, como ocorre em um Sistema de Gerenciamento de Bases de Dados Relacional (SGBDR). Serão abordados conceitos de recuperação de dados por conteúdo, explorando as técnicas específicas de recuperação de dados aplicadas a domínios de dados complexos tais como imagens, áudio e dados multidimensionais, onde os elementos de dados são comparados por meio de uma função de avaliação de similaridade, com ênfase no tratamento de bases de imagens. Com isso, pretende-se que o aluno possa fazer uma análise crítica das técnicas de construção de aplicativos que precisam efetuar buscas e recuperar dados complexos em grandes coleções de dados, tornando-se apto a desenvolver aplicativos de ponta em áreas de atividade tais como apoio ao diagnóstico médico por imagens, recuperação e análise de dados de satélite para apoio à agronomia e previsão de clima, visualização e recuperação de coleções de vídeo e fotografia


Justificativa:

Tem havido crescente disponibilidade de novas formas de coleta de dados e de informações, em grande volume e variedade de formatos, tais como dispositivos móveis (celulares e tablets), redes de sensores (dispositivos de automação e IOT) e equipamentos de coleta de dados em formato digital (equipamentos científicos, industriais, de exames médicos, dentre outros.). Por outro lado, o tratamento individual dos dados depende cada vez mais de informação obtida da análise das coleções a que cada elemento pertence. Por exemplo, quando uma imagem de um exame médico precisa ser analisada, o radiologista frequentemente se apoia em ferramentas de auxílio ao diagnóstico que leva em consideração casos anteriores que tenham imagens semelhantes à atual, onde a aplicação de diferentes processos de tratamento levaram a resultados diferentes. No entanto, a busca de dados complexos depende de técnicas diferentes daquelas normalmente usadas para o tratamento de dados escalares (como números e pequenas cadeias de caracteres). Assim, o conhecimento das tecnologias empregadas na construção de aplicações que manipulam dados complexos torna-se importante para se obter desempenho e eficiência adequados. Além disso, do ponto de vista do desenvolvimento de pesquisas na área de bases de dados, um conhecimento sólido das técnicas de busca por similaridade em conjuntos de dados complexos é fundamental, pois a evolução do estado da arte somente pode ser conseguida quando corretamente contextualizada nas tecnologias mais recentes para se desenvolver tais sistemas.


Conteúdo:

- Arquitetura de sistemas de recuperação de dados complexos por similaridade;
- Ferramentas computacionais para recuperação de dados complexos por similaridade;
- Sistemas de Recuperação de dados complexos por conteúdo;
- Técnicas para extração de características de imagens e áudio;
- Funções de distância para dados dimensionais, conjuntos, sequências e grafos;
- Técnicas para indexação de dados em espaços métricos.


Forma de avaliação:

Avaliação dos seminários e exercícios realizados pelos alunos (50% da nota final) e avaliação de cada uma das partes que compõem o projeto da disciplina (50% da nota final). Conceito A para nota maior ou igual a 8.5. Conceito B para nota maior ou igual a 7.0 e menor que 8.5. Conceito C para nota maior ou igual a 6.0 e menor que 7.0. Conceito R para nota menor que 6.0


Observação:

FORMA DE OFERECIMENTO
Híbrido (partes presenciais e partes remotas)

PORCENTAGEM DA DISCIPLINA QUE OCORRERÁ NO SISTEMA NÃO PRESENCIAL (1-100%)
5 a 10%

JUSTIFICATIVA DE NECESSIDADE DE DISCIPLINA REMOTA OU HÍBRIDA
Algumas atividades práticas são mais bem conduzidas tendo cada aluno em seu ambiente de trabalho, seja no laboratório, escritório, ou residência. Isto pois, tais atividades demandam softwares de alta complexidade, os quais são mais prontamente configuráveis em máquinas nas quais os alunos tenham pleno acesso. Com atividades remotas, cada aluno poderá conduzir suas atividades sem depender das limitações dos ambientes computacionais de ensino, os quais são controlados e com recursos limitados.

DETALHAMENTO DAS ATIVIDADES QUE SERÃO PRESENCIAIS E DAS QUE SERÃO DESENVOLVIDAS VIA REMOTA, COM DISCRIMINAÇÃO DO TEMPO DE ATIVIDADE CONTÍNUA ONLINE
Nas aulas presenciais, serão apresentados e discutidos conceitos teóricos, exercícios e seminários realizados pelo alunos, bem como o projeto da disciplina. Nas aulas remotas, serão realizados exercícios de desenvolvimento de sistemas para recuperação de dados baseada em conteúdo, dinâmicas para se definir os requisitos e técnicas para o desenvolvimento do projeto, e apresentação de seminários técnicos.

ESPECIFICAÇÃO SE AS AULAS, QUANDO ONLINE, SERÃO SÍNCRONAS OU ASSÍNCRONAS
Síncronas

DESCRIÇÃO DO TIPO DE MATERIAL E/OU CONTEÚDO QUE SERÁ DISPONIBILIZADO PARA O ALUNO
Serão disponibilizados slides, livros, capítulos de livros e artigos. As aulas online serão gravadas e disponibilizadas aos alunos.

PLATAFORMA QUE SERÁ UTILIZADA
Tidia-USP

DEFINIÇÃO SOBRE A PRESENÇA NA UNIVERSIDADE E, QUANDO NECESSÁRIA, DISCRIMINAR QUEM DEVERÁ ESTAR PRESENTE (PROFESSOR; ALUNOS; AMBOS)
Ambos

DESCRIÇÃO DOS TIPOS E DA FREQUÊNCIA DE INTERAÇÃO ENTRE ALUNOS E PROFESSOR (SOMENTE DURANTE AS AULAS; FORA DO PERÍODO DAS AULAS; HORÁRIOS; POR CHAT/E-MAIL/FÓRUNS OU OUTRO);
A interação entre professor e alunos ocorrerá durante as aulas (presenciais e online), e em horários fora de sala de aula por meio de ferramentas, tais como email, e vídeo chamadas.

SERÃO UTILIZADAS METODOLOGIAS ATIVAS DE ENSINO E ATIVIDADES DE COOPERAÇÃO E COLABORAÇÃO ENTRE OS ALUNOS?
Não serão utilizadas metodologias ativas de ensino e atividades de cooperação/colaboração entre os alunos.

FORMA DE CONTROLE DA FREQUÊNCIA NAS AULAS
Participação dos alunos nas aulas tanto presenciais quanto online.

INFORMAÇÃO SOBRE A OBRIGATORIEDADE OU NÃO DE DISPONIBILIDADE DE CÂMERA E ÁUDIO (MICROFONE) POR PARTE DOS ALUNOS
Não haverá obrigatoriedade, mas seria desejável.

FORMA DE AVALIAÇÃO DA APRENDIZAGEM (PRESENCIAL/REMOTA)
Apresentação de seminários, resolução de exercícios e realização do projeto da disciplina.

CRITÉRIOS DE AVALIAÇÃO CONTEMPLANDO QUAL A(S) METODOLOGIA(S) UTILIZADA(S) E COMO SER(Á)ÃO ATRIBUÍDO(S) O(S) CONCEITO(S)
Avaliação dos seminários e exercícios realizados pelos alunos (50% da nota final) e avaliação de cada uma das partes que compõem o projeto da disciplina (50% da nota final). Conceito A para nota maior ou igual a 8.5. Conceito B para nota maior ou igual a 7.0 e menor que 8.5. Conceito C para nota maior ou igual a 6.0 e menor que 7.0. Conceito R para nota menor que 6.0.

MENCIONAR AS MEDIDAS QUE GARANTAM AOS ALUNOS ACESSO À PLATAFORMA (SALA DE AULA COM INFRAESTRUTURA DE MULTIMÍDIA, SALA PRÓ-ALUNO; EQUIPAMENTOS NECESSÁRIOS A PARTICIPAÇÃO DOS ALUNOS E OUTROS)
Usuário USP.


Bibliografia:

Fundamentais:
-Leskovec, Jure, Anand Rajaraman, and Jeffrey David Ullman. Mining of massive data sets. Cambridge university press, 2020.
- Deepak P, Prasad M. Deshpande: Similarity Search - Semantics, Techniques and Usage Scenarios. Springer 2015.
- P. Zezula, G. Amato, V. Dohnal, and M. Batko, Similarity Search: The Metric Space Approach. New York, NY, USA: Springer New York, 2006.
- G. Lu, Multimedia Database Management Systems: Artech House, 2004.
- H. Samet, Foundations of Multidimensional and metric Data Structures. San Francisco, CA: Morgan Kaufmann Publishers, 2006.
- C. Faloutsos, Searching Multimedia Databases by Content. Boston, MA: Kluwer Academic Publishers, 1996.

Complementares:
- P. M. d. Azevedo-Marques, A. Mencattini, M. Salmeri, and R. M. Rangayyan, Medical Image Analysis and Informatics: Computer-Aided Diagnosis and Therapy, 1' ed. London: CRC Press, Taylor & Francis Group, 2017.
- P. M. d. A. Marques and R. M. Rangayyan, Content-based Retrieval of Medical Images: Landmarking, Indexing, and Relevance Feedback: Morgan & Claypool Publishers, 2013.
- D. Gusfield, Algorithms on Strings, Trees, and Sequences - Computer Science and Computational Biology, vol. 1. Cambridge, MA: Cambridge University Press, 1997.

CONECTE-SE COM A GENTE
 

© 2024 Instituto de Ciências Matemáticas e de Computação