Empresas Premium
Un nuevo estudio dirigido por el Instituto de Ciencias Químicas e Ingeniería -ISIC (EPFL) muestra cómo los modelos lingüísticos pueden guiar la síntesis química y explicar las reacciones mediante instrucciones en lenguaje sencillo.
El diseño de moléculas es uno de los retos más complejos de la química. Desde fármacos que salvan vidas hasta materiales avanzados, cada compuesto requiere una secuencia precisa de reacciones. Planificar estos pasos exige tanto conocimientos técnicos como visión estratégica, por lo que a menudo se requiere de años de experiencia.
Dos problemas aquejan a gran parte de la química moderna. El primero es la retrosíntesis: los químicos parten de una molécula objetivo y trabajan hacia atrás para identificar bloques de construcción más simples y rutas de reacción viables. La retrosíntesis implica innumerables decisiones, desde la elección de los materiales de partida hasta la determinación del momento adecuado para formar anillos o proteger grupos funcionales sensibles. Si bien las computadoras pueden explorar vastos "espacios químicos", a menudo tienen dificultades para capturar el razonamiento estratégico que utilizan los expertos humanos.
El segundo problema reside en los mecanismos de reacción. Estos describen cómo se desarrollan las reacciones químicas paso a paso mediante el movimiento de electrones. La comprensión de estos mecanismos ayuda a los científicos a predecir nuevas reacciones, mejorar la eficiencia y reducir los costosos procesos de ensayo y error. Los métodos computacionales existentes pueden generar muchas vías posibles, pero a menudo carecen de la intuición química necesaria para identificar las más plausibles.
Por todo ello, un nuevo estudio dirigido por Philippe Schwaller en la EPFL ha desarrollado un nuevo enfoque que utiliza modelos de lenguaje a gran escala (LLM, por sus siglas en inglés) como motores de razonamiento para la química. En lugar de generar estructuras químicas directamente, los modelos evalúan y guían las herramientas computacionales tradicionales.
El sistema, denominado Synthegy, combina algoritmos de búsqueda ya establecidos con inteligencia artificial capaz de interpretar estrategias químicas expresadas en lenguaje natural.
"Al crear herramientas para químicos, la interfaz de usuario es fundamental, y las herramientas anteriores dependían de filtros y reglas engorrosas", afirma Andrés M. Bran, primer autor del artículo sobre Synthegy publicado en Matter . "Con Synthegy, les damos a los químicos la posibilidad de comunicarse fácilmente, lo que les permite iterar mucho más rápido y explorar ideas sintéticas más complejas".
La síntesis comienza con una molécula objetivo y una instrucción clara del usuario. Por ejemplo, un químico puede solicitar la formación temprana de un anillo específico o pedir que se eviten grupos protectores innecesarios. El software de retrosíntesis tradicional genera entonces numerosas rutas sintéticas potenciales. Cada ruta se traduce a texto y se analiza mediante un modelo de lenguaje.
Synthegy evalúa la adecuación de cada ruta a los objetivos del usuario, asigna puntuaciones y explica su razonamiento. Este proceso permite a los investigadores clasificar y filtrar rutas candidatas de manera eficiente. Al guiar las búsquedas computacionales con consultas en lenguaje natural, los químicos pueden centrarse en las estrategias que mejor se ajusten a sus objetivos.
La síntesis aborda los mecanismos de reacción de forma similar: descompone las reacciones en movimientos elementales de electrones y explora múltiples posibilidades. El modelo LLM evalúa cada paso, guiando la búsqueda hacia mecanismos químicamente plausibles. También se puede incorporar información adicional, como las condiciones de reacción o las hipótesis de expertos, como texto.
En la planificación de síntesis, Synthegy identificó con éxito rutas que se ajustan a requisitos estratégicos complejos. En un estudio de expertos a doble ciego, 36 químicos proporcionaron 368 evaluaciones válidas, y sus juicios coincidieron con las evaluaciones del sistema en un 71,2 % de los casos, en promedio. El marco permite detectar pasos de protección innecesarios, evaluar la viabilidad de las reacciones y priorizar las rutas más eficientes.
Synthegy demuestra que los modelos LLM pueden analizar la química en múltiples niveles. Pueden interpretar grupos funcionales, evaluar reacciones individuales y analizar rutas sintéticas completas. Los modelos más grandes y avanzados ofrecen el mejor rendimiento, mientras que los más pequeños presentan capacidades limitadas.
Este trabajo redefine cómo la IA puede apoyar la química. Al posicionar a los modelos de lógica descriptiva (MLD) como evaluadores en lugar de generadores, el enfoque de Synthegy permite a los químicos expresar sus objetivos en un lenguaje sencillo y recibir soluciones estratégicamente relevantes. Esta tecnología podría acelerar el descubrimiento de fármacos, mejorar el diseño de reacciones y facilitar el acceso de los investigadores a herramientas computacionales avanzadas.
"La conexión entre la planificación de la síntesis y los mecanismos es muy interesante: solemos usar mecanismos para descubrir nuevas reacciones que nos permiten sintetizar nuevas moléculas", afirma Andrés M. Bran. "Nuestro trabajo consiste en salvar esa brecha computacionalmente mediante una interfaz unificada en lenguaje natural".
Referencia: Andres M Bran, Théo A. Neukomm, Daniel Armstrong, Zlatko Jončev, Philippe Schwaller. Matter, 24 de abril de 2026. DOI: 10.1016/j.matt.2026.102812
|