Recientemente, una
noticia publicada en la revista Nature se hacía eco del que podría ser el modelo de IA más potente en biología, capaz de facilitar el desarrollo de genomas completos desde cero. Se trata de Evo 2, y ha sido desarrollado por investigadores del Arc Institute de EE.UU. y del fabricante de chips NVIDIA, en colaboración con expertos de la Universidad de Stanford y de la Universidad de California en Berkeley y San Francisco.
El modelo de IA puede aprender sobre la complejidad del genoma por sí solo
Según los autores, gracias a este entrenamiento con datos genómicos masivos, Evo 2 es capaz de aprender las complejidades de la información almacenada en el ADN por sí solo, como, por ejemplo, los límites entre intrones y exones, dianas de unión de factores de transcripción y elementos clave para la estructura de proteínas.
También puede predecir el impacto de variantes genéticas sobre la funcionalidad a nivel de ARN, proteína u organismo. Por ejemplo, el modelo tuvo una precisión del 90% a la hora de clasificar como inocuas o patogénicas variantes conocidas del gen BRCA1, que se relaciona con el cáncer de mama. Así mismo, Evo 2 puede generar nuevas secuencias genéticas de cero y elaborar pequeños genomas completos, como los de bacterias y levaduras.
Por todo ello, los autores consideran que el modelo puede ser de utilidad para diseñar nuevas herramientas en biología o incluso nuevos tratamientos.
Evo 2 es totalmente abierto y está disponible para toda la comunidad científica con el objetivo de que especialistas de diversos ámbitos lo pongan a prueba, y también para que puedan adaptarlo a sus propias necesidades.
Referencia
Brixi G, Durrant MG, Ku J, et al. Genome modeling and design across all domains of life with Evo 2.
bioRxiv>/em>. 2025.02.18.638918. doi:10.1101/2025.02.18.638918
OAD-ES-AMG-0001