Existen centenares de miles de proteínas identificadas, muchas de ellas de especial interés en biomedicina, como los
anticuerpos. No obstante, sintetizar proteínas totalmente nuevas no presentes en la naturaleza para un propósito específico es un reto que la inteligencia artificial (IA) podría facilitar.
En este sentido, el Centro de Regulación Genómica (CRG) de Barcelona trabajará en el desarrollo de una IA generativa cuyo objetivo será diseñar proteínas sintéticas con funciones concretas que no existen en la naturaleza. El proyecto, bautizado como ATHENA, cuenta con una subvención de 1,5 millones de euros del Consejo Europeo de Investigación para una duración de cinco años.
Según explican los responsables, ATHENA será un gran modelo de lenguaje igual que los conocidos
chatbots de IA ChatGPT, Gemini o Copilot, pero se entrenará no solo en base al lenguaje de las proteínas —su secuencia de aminoácidos—, sino también a su
estructura 3D, su dinámica y la información sobre su funcionalidad.
ATHENA busca ser un modelo de IA para el diseño transparente y fiable de proteínas sintéticas
Los expertos del CRG destacan que esto sería como entrenar a un chatbot con texto, imágenes y vídeos al mismo tiempo, y el objetivo no es otro que facilitar que el nuevo modelo de IA sea versátil y potente a la hora de crear proteínas con funciones personalizadas. Como ejemplo citan la posibilidad de crear una proteína con capacidades mejoradas para capturar CO2, ofreciendo una nueva herramienta para hacer frente al desafío que representa el calentamiento global.
Uno de los principales retos del proyecto es que ATHENA tendrá que ser una IA explicable, de manera que los usuarios sean capaces de comprender en todo momento por qué el modelo toma las decisiones que toma. Los responsables consideran que esto es esencial para confiar en dicha tecnología y en sus resultados.
Además, el nuevo modelo se elaborará en base al aprendizaje por refuerzo, una estrategia que imita el modo en que los humanos aprendemos con la experiencia. Esto permitirá que ATHENA se retroalimente para mejorar con el tiempo, de modo que cada nuevo diseño de una proteína tenga cada vez más probabilidades de resultar exitoso.
OAD-ES-AMG-0001