Los avances en
inteligencia artificial (IA) generativa, sobre todo en relación con los grandes modelos de lenguaje (LLM, por las siglas en inglés), han hecho que dicha tecnología esté ya presente en muchos sectores productivos. Sin embargo, la investigación biomédica no está aprovechando todo su potencial, como por ejemplo en la extracción y el análisis de datos.
Los motivos por los que esto sucede serían múltiples, pero, en general, las plataformas comerciales de IA no ofrecen los estándares de transparencia necesarios para garantizar la reproducibilidad de la investigación. Además, no son completamente adaptables a las necesidades de dicha investigación y sus flujos de trabajo.
Para superar estas barreras, un equipo internacional de expertos, liderados desde el European Molecular Biology Laboratory (EMBL), ha desarrollado
BioChatter. Se trata de un entorno de código abierto que permite conectar aplicaciones biomédicas con diversos LLM; y lo hace siguiendo criterios de transparencia y flexibilidad para poder adaptarse a distintas necesidades de investigación.
BioChatter es adaptable y permite analizar información de bases de datos y de literatura científica mediante LLM
Las características de la herramienta se han publicado en
Nature Biotechnology. Y en una
noticia publicada por el EMBL, sus responsables consideran que BioChatter facilita que científicos biomédicos aprovechen las capacidades de los LLM en su actividad diaria sin necesidad de tener conocimientos de programación.
La plataforma es adaptable a distintas necesidades y permite extraer información de bases de datos y de literatura científica y analizarla mediante los LLM disponibles. Así mismo, BioChatter puede integrarse con los gráficos de conocimiento de
BioCypher, que relacionan mutaciones genómicas con posibles patologías y dianas terapéuticas, entre otras informaciones de interés clínico.
Entre los siguientes pasos para mejorar las funcionalidades de la plataforma destaca su integración en bases de datos biomédicas como
Open Targets, que contiene datos genómicos humanos para la identificación de dianas terapéuticas, y con la que ya se está colaborando.
Por otro lado, los responsables también están trabajando en un sistema, denominado BioGather, capaz de extraer información de otra tipología de datos clínicos, como notas médicas y registros de imagen, con el objetivo de facilitar el avance hacia una medicina cada vez más personalizada.
Referencia
Lobentanzer S, Feng S, Bruderer N, et al. A platform for the biomedical application of large language models.
Nat Biotechnol. Published online January 22, 2025.
doi:10.1038/s41587-024-02534-3
OAD-ES-AMG-0001