OpenAI ha anunciado el desarrollo de GPT-Rosalind, un modelo de lenguaje entrenado específicamente para flujos de trabajo biológicos comunes, nombrándolo en honor a Rosalind Franklin, la científica cuyo trabajo fue fundamental para descubrir la estructura del ADN. A diferencia de los modelos científicos de las grandes tecnológicas, que generalmente han adoptado enfoques más genéricos que funcionan en múltiples campos, GPT-Rosalind está diseñado específicamente para las necesidades de la investigación biológica.

En una conferencia de prensa, Yunyun Wang, directora de producto de Ciencias de la Vida de OpenAI, explicó que el sistema fue diseñado para abordar dos obstáculos principales que enfrentan los investigadores en biología actualmente. El primero es la enormidad de los conjuntos de datos creados por décadas de secuenciación genómica y bioquímica de proteínas, que pueden ser excesivos para un solo investigador. El segundo es que la biología tiene muchos subcampos altamente especializados con jergas y metodologías propias.

La herramienta permite a los investigadores procesar volúmenes masivos de datos genéticos y proteicos, identificar patrones en secuencias de ADN y proteínas, y sintetizar información de múltiples subcampos biológicos que tradicionalmente requerirían años de formación especializada para comprender. Los científicos que han probado el modelo en fase piloto han destacado su capacidad para explicar conexiones entre campos que normalmente operan en silos.

La llegada de GPT-Rosalind representa un paso más en la aplicación de modelos de lenguaje a la investigación científica, un área donde la inteligencia artificial está comenzando a demostrar capacidades que complementan el trabajo de investigadores humanos. Varios laboratorios farmacéuticos y centros de investigación en genómica ya han expresado interés en integrar el modelo en sus flujos de trabajo de descubrimiento de fármacos y comprensión de enfermedades.