Novos modelos de IA podem mudar o jogo na ciência das proteínas e nos cuidados de saúde



Os investigadores desenvolveram novos modelos de IA que podem melhorar consideravelmente a precisão e a descoberta no domínio da ciência das proteínas. Potencialmente, os modelos ajudarão as ciências médicas a ultrapassar os atuais desafios no âmbito, por exemplo, da medicina personalizada, da descoberta de medicamentos e do diagnóstico.

Na sequência de ferramentas de IA amplamente disponíveis, a maioria dos domínios técnicos e das ciências naturais está a avançar rapidamente. Isto é particularmente verdade no domínio da biotecnologia, em que os modelos de IA permitem avanços na descoberta de medicamentos, na medicina de precisão, na edição de genes, na segurança alimentar e em muitos outros domínios de investigação.

Um subcampo é a proteómica – o estudo das proteínas em grande escala – em que vastas quantidades de dados sobre proteínas são reunidas em bases de dados com as quais uma amostra pode ser comparada. Estas bases de dados permitem aos cientistas discernir quais as proteínas – e, consequentemente, os microrganismos – que estão presentes numa amostra. Permitem a um médico diagnosticar doenças, monitorizar a eficácia de um tratamento ou identificar agentes patogénicos presentes na amostra de um doente.

Embora estas ferramentas sejam muito úteis e eficazes, há limites para o que podem fazer, diz Timothy Patrick Jenkins, Professor Associado da DTU Bioengineering e autor correspondente.

“Em primeiro lugar, nenhuma base de dados inclui tudo, pelo que é necessário saber que bases de dados são relevantes para as nossas necessidades específicas. Depois, as pesquisas profundas são muito demoradas e exigem muita potência informática. E, finalmente, é quase impossível identificar proteínas que ainda não foram registadas”, sublinha.

Por esta razão, alguns grupos têm trabalhado nos chamados “algoritmos de sequenciação de novo” que melhoram a precisão e reduzem os custos computacionais com o aumento do tamanho da base de dados. Ainda assim, de acordo com Jenkins e colegas da DTU, da Universidade de Delft, nos Países Baixos, e da empresa britânica de IA InstaDeep, o seu desempenho continua a ser “pouco satisfatório”.

Ultrapassar o estado da arte

Num novo artigo publicado na revista Nature Machine Intelligence, propõem dois novos modelos de IA para ajudar os investigadores, os médicos e as entidades comerciais a encontrar exatamente a informação necessária nas vastas quantidades de dados. Chamam-se InstaNovo e InstaNovo+ e estão disponíveis para os investigadores através do sítio Web InstaDeep (ver caixa de factos).

“Vistos em conjunto, os nossos modelos excedem o estado da arte e são significativamente mais precisos do que as ferramentas atualmente disponíveis. Além disso, como mostramos no documento, os nossos modelos não são específicos de uma determinada área de investigação. Em vez disso, estas ferramentas podem impulsionar avanços significativos em todos os domínios que envolvem a proteómica”, afirma Kevin Michael Eloff, engenheiro de investigação da InstaDeep e coautor do primeiro artigo.

Para avaliar a utilidade dos seus modelos, os investigadores treinaram-nos e testaram-nos em várias tarefas específicas em grandes áreas de interesse.

Uma investigação foi efectuada em fluidos de feridas de doentes com úlceras venosas nas pernas. Uma vez que as úlceras venosas das pernas são notoriamente difíceis de tratar e se tornam frequentemente crónicas, saber que microrganismos, como as bactérias, estão presentes é crucial para o tratamento. Os modelos conseguiram mapear dez vezes mais sequências do que uma pesquisa na base de dados, entre elas E. coli e Pseudomonas aeruginosa – sendo esta última uma bactéria multirresistente.

Outro caso de utilização foi realizado em pequenos pedaços de proteínas, denominados péptidos, presentes na superfície das células. Estes ajudam o sistema imunitário a reconhecer infeções e doenças como o cancro. Os modelos InstaNovo identificaram milhares de novos péptidos que não foram encontrados através dos métodos tradicionais. Nos tratamentos personalizados contra o cancro que potenciam o sistema imunitário – abreviadamente, imunoterapia – estes péptidos são todos potenciais pontos de ataque.

“Em combinação, os nossos testes do modelo em casos complexos, onde, por exemplo, estão presentes proteínas desconhecidas, ou onde não temos conhecimento prévio dos organismos envolvidos, mostram que são adequados para melhorar significativamente a nossa compreensão. É óbvio que isto é um bom presságio para a biomedicina, uma vez que pode melhorar diretamente a identificação do nosso microbioma, bem como os nossos esforços no âmbito da medicina personalizada e da imunologia do cancro”, afirma Konstantinos Kalogeropoulos, coautor do primeiro artigo e professor assistente na DTU Bioengineering.

O documento apresenta seis casos adicionais que demonstram como estes modelos melhoram a sequenciação terapêutica, descobrem novos péptidos, detetam organismos não registados e melhoram significativamente as pesquisas proteómicas. As implicações dos seus resultados vão muito para além das ciências médicas, afirma Timothy Patrick Jenkins.

“Olhando para isto de uma perspetiva puramente técnica e científica, também é verdade que, com estas ferramentas, podemos melhorar a nossa compreensão do mundo biológico como um todo, não só em termos de cuidados de saúde, mas também na indústria e no mundo académico. Em todos os domínios que utilizam a proteómica – seja a fitotecnia, a veterinária, a biotecnologia industrial, a monitorização ambiental ou a arqueologia – podemos obter informações sobre paisagens proteicas que até agora eram inacessíveis”, explica.

O que são InstaNovo e InstaNovo+?

O InstaNovo é um modelo baseado em transformador concebido para a sequenciação de novo de péptidos. Desenvolvido em colaboração entre a InstaDeep e o Departamento de Biotecnologia e Biomedicina da Universidade Técnica da Dinamarca (DTU), traduz picos de iões de fragmentos de dados de espetrometria de massa em sequências de péptidos com uma precisão sem precedentes.

Ao contrário dos métodos tradicionais que dependem de bases de dados pré-existentes, a InstaNovo identifica péptidos que nunca foram documentados antes – expandindo o panorama da descoberta proteómica.

Uma inovação fundamental dos modelos InstaNovo é o InstaNovo+, um modelo de refinamento iterativo baseado na difusão que aumenta a precisão da sequência, imitando a forma como os investigadores refinam manualmente as previsões de péptidos. A InstaNovo+ começa com uma sequência inicial – derivada da InstaNovo ou gerada aleatoriamente – e melhora-a, passo a passo.

Quando emparelhada com a InstaNovo, a InstaNovo+ reduz significativamente as taxas de falsas descobertas (FDR) e melhora a precisão da sequência, não apenas refinando as previsões, mas explorando uma gama mais ampla de potenciais sequências de peptídeos.

Ao contrário dos modelos auto-regressivos, como o InstaNovo e outros, que prevêem sequências de péptidos um aminoácido de cada vez, o InstaNovo+ processa sequências inteiras de forma holística, permitindo uma maior precisão e taxas de deteção mais elevadas.

Em conjunto, a InstaNovo e a InstaNovo+ melhoram a sequenciação de péptidos de novo, estabelecendo um equilíbrio entre precisão e exploração para acelerar a descoberta biológica.






Notícias relacionadas



Comentários
Loading...