Según dos noticias publicadas recientemente en Nature, la comunidad científica estaría entusiasmada con DeepSeek-R1, un modelo de inteligencia artificial (IA) lanzado en enero que, según los test realizados por la propia empresa china, igualaría las capacidades de modelos similares de la competencia, como o1 de OpenAI, pero con un coste menor.
Además, DeepSeek-R1 se ofrece en formato abierto, bajo una licencia MIT. Esto permite a los científicos descargarlo gratuitamente, analizar su algoritmo y entrenarlo mediante lo que se denomina un ajuste fino (fine tuning, en inglés) para adaptarlo a sus necesidades de investigación. No obstante, los datos con los que se ha entrenado el nuevo modelo no están disponibles para su análisis, por lo que no se puede considerar una herramienta totalmente abierta.
Otra de las ventajas de descargar R1 al completo, o alguna de sus versiones más ligeras, en local para probarlo y adaptarlo es que puede resultar interesante en ámbitos en que la confidencialidad de los datos sea relevante, como en la
investigación biomédica.
DeepSeek-R1 se creó a partir de una versión anterior mediante aprendizaje por refuerzo
Una de las noticias cita datos de Hugging Face, una plataforma para compartir modelos de IA, indicando que el
modelo R1 completo o alguna de sus versiones, incluidas las realizadas por usuarios independientes, sumarían más de tres millones de descargas hasta finales de enero.
Al igual que o1, R1 es lo que se denomina un modelo de “razonamiento”, lo que implica que se ha desarrollado mediante metodologías que mejoran las capacidades de los grandes modelos de lenguaje para llevar a cabo tareas más complejas, y por eso son atractivos en investigación.
Según explica uno de los artículos, R1 se creó a partir de una versión anterior mediante aprendizaje por refuerzo, ofreciendo recompensas cada vez que el modelo alcanzaba la respuesta correcta. Y al ofrecerse en abierto, el “razonamiento” que el modelo aplica está disponible para su escrutinio por parte de los investigadores.
En cualquier caso, también se recoge que R1 dista mucho de ser infalible y que, a pesar de tener un rendimiento similar a o1 en ámbitos como la bioinformática o la química computacional, algunos expertos consultados indican que era más lento.
Referencia
Gibney E. Scientists flock to DeepSeek: how they're using the blockbuster AI model.
Nature. Published online January 29, 2025.
doi:10.1038/d41586-025-00275-0
OAD-ES-AMG-0001