Com apenas 22 anos, o pesquisador Bruno Rafael Florentino se tornou o primeiro sul-americano a conquistar a medalha de ouro Thomas Clarkson na edição 2024 do Global Undergraduate Award, que reconhece os melhores trabalhos de conclusão de curso (TCC). Ele venceu o prêmio na categoria ciências de computação com a pesquisa Bioprediction PPI – Predict Interactions Between Biological Sequences, que apresenta uma ferramenta de inteligência artificial capaz de prever interações entre proteínas.
A solução desenvolvida por Bruno otimiza o tempo que os biólogos passam no laboratório, gerando automaticamente predições de interações entre sequências biológicas, evitando que os profissionais precisem testar reações entre proteínas uma a uma, o que facilita o trabalho desses profissionais. Agora, o estudante segue aprimorando a ferramenta como doutorando no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.
Nascido em Guaxupé, no Sul de Minas Gerais, Bruno começou sua trajetória acadêmica no Instituto de Física de São Carlos (IFSC) da USP, ingressando inicialmente no curso de Bacharelado em Física. Contudo, já no primeiro ano migrou para o curso de Ciências Físicas e Biomoleculares e, no 5º período, enquanto cursava a disciplina Biologia Molecular Computacional, Bruno vislumbrou seu futuro no universo da programação. “Eu sou um desastre em laboratório, prefiro ficar no computador”, diverte-se o doutorando ao lembrar de suas aventuras no laboratório.
Animado com a agilidade do mundo da ciência de dados, Bruno procurou o professor André Ponce de Leon, docente e diretor do ICMC, para participar dos grupos de pesquisa coordenados pelo pesquisador. Muito diferente do ritmo mais lento dos testes in vitro da biologia, o estudante encontrou na computação o ambiente perfeito para aplicar seus conhecimentos e dar início a sua pesquisa. “Dentro da computação eu tenho maior controle do que consigo fazer”, complementa Bruno.
O biólogo como protagonista – Foi em busca de oferecer mais controle, desta vez à rotina dos biólogos, que Bruno aplicou seu conhecimento interdisciplinar para desenvolver a ferramenta que foi tema do seu TCC: “Eu mesclo o conhecimento que vem da biologia com a computação, pensando no que o biólogo vai precisar na prática.”
Segundo ele, esse é justamente o diferencial do seu modelo de linguagem de programação, que democratiza o acesso à computação para biólogos. “Você tira o protagonismo do cientista da computação e coloca no biólogo”, sintetiza Bruno. Até então, os programas da área não possibilitavam que um biólogo trabalhasse sem o apoio de um cientista da computação, que desenvolvia novos modelos cada vez que se iniciava uma pesquisa.
Além de simplificar o trabalho dos biólogos, a solução criada por Bruno pode acelerar a produção de novos fármacos. Um exemplo da utilização da tecnologia é no estudo do comportamento de patógenos em nosso organismo. “Quando um novo vírus entra em contato com o nosso corpo, ele pode reagir com diversas moléculas. Todo nosso metabolismo é regido por interações entre proteínas”, explica Bruno. “”O nosso sistema imunológico reconhece agentes patogénicos por meios de interações com a membrana do patogeno, portanto mapear esse tipo de interação é importante para entender o mecanismo da infecção e desenvolver terapias. Daí a importância de prever essas interações”, complementa.
Contudo, a gama de possibilidades é gigante. Assim como nosso DNA, cada proteína tem uma sequência robusta de letras, formando sua própria identidade. É a partir da combinação dessas letras que Bruno calcula as possibilidades de interação e combinações favoráveis: “Em um dos meus experimentos, foram analisados 15 mil pares de possíveis interações entre proteínas do vírus Influenza A, e a ferramenta conseguiu reduzir esse número para 1.265 interações prováveis. Dessas, 75% eram de fato interações positivas, o que significa que o modelo acertou 3 em cada 4 predições.”
Aplicando o modelo de linguagem desenvolvido por Bruno, o próprio biólogo consegue, com uma linguagem muito próxima da coloquial, pedir ao programa que faça a previsão das possíveis reações dessas sequências proteicas. “Se eu consigo fazer isso computacionalmente em menos de um dia, podemos descobrir muitas novas interações, agilizando o trabalho dos biólogos”, comemora Bruno. Com a previsão computadorizada, o cientista reduz a quantidade de combinações possíveis, poupando tempo de experimentação no laboratório.
De acordo com Bruno, a ferramenta também cumpre um papel social de democratização da pesquisa, simplificando o trabalho dos profissionais da saúde. “Agora, todo pesquisador pode fazer o próprio modelo conforme os dados que têm”, celebra. Essa autonomia permite que cada biólogo realize suas pesquisas sem os pesados investimentos que, muitas vezes, só aparecem em projetos de alcance global. Para Bruno, isso pode auxiliar no combate a doenças negligenciadas por fatores geográficos, por exemplo.
Para alcançar esses resultados positivos, Bruno utilizou mais de dez bases de dados de biologia disponíveis e comparou seu modelo com mais de 20 ferramentas já existentes. “Eu testei muita coisa, e meu modelo foi muito competitivo porque ele é consistente”, destaca.
A importância da mentoria – A especialização de Bruno na área começou quando o diretor do ICMC o apresentou ao doutorando Robson Parmezan Bonidia. A partir da parceria construída, Bruno encontrou sinergia entre suas ideias e outras pesquisas em andamento no grupo, sendo guiado pelos valores do professor André Ponce, que preza por criar soluções de inteligência artificial responsáveis e democráticas.
Foi ainda durante a graduação em Ciências Físicas e Biomoleculares no IFSC que Bruno iniciou o trabalho que culminaria no prêmio e, mais tarde, o levaria diretamente ao doutorado no ICMC. “Eu já estava fazendo uma pesquisa inovadora na graduação”, relembra o doutorando, que teve orientação de André no TCC.
Mais do que um prêmio, Bruno vislumbra a vitória como uma oportunidade de ampliar ainda mais as fronteiras de sua pesquisa: “Meu objetivo agora é validar minha ferramenta junto a biólogos, aplicando-a em problemas reais, algo que nunca vi ser feito antes. A ideia é que os biólogos possam treinar seus próprios modelos preditivos, sem necessidade de programação”.
Agora, Bruno se prepara para a cerimônia de entrega da premiação, que acontecerá em Dublin, capital da Irlanda, um cenário que promete abrir portas para novas parcerias e colaborações: “Quero conhecer os jurados, quem sabe surge uma oportunidade de pesquisa ou troca de conhecimento”.
Com suas metas traçadas e um espírito inquieto, o doutorando já pensa nos próximos desafios recheados de planos internacionais. “Eu quero ir para Alemanha, a maior parte dos artigos da minha área são de lá, essa é uma das minhas metas”, finaliza.
Texto: Carolina Pelegrin, da Fontes Comunicação Científica
Mais informações
Sobre o Prêmio: https://undergraduateawards.com
Acesse o artigo resultante do trabalho de conclusão de curso:
BioPrediction-RPI: Democratizing the prediction of interaction between non-coding RNA and protein with end-to-end machine learning – https://doi.org/10.1016/j.csbj.2024.05.031