不到4分钟,就能复现诺奖实验!Nature重磅:AI轻松实现阿司匹林、布洛芬等药物合成,人工智能科研机器来了?

2023-12-28 Swapgg MedSci原创 发表于上海

Nature:AI“化学家”Coscientist(一款基于GPT-4等大型语言模型的AI系统),竟能自主设计、规划和执行复杂的实验

短短4分钟的时间,AI“科学家”竟然成功地复现了诺奖实验成果,且只尝试了一次!

2023年12月20日,Nature上刊登的最新研究再一次刷新了人类的认知。这个由卡内基梅隆大学(CMU)研究团队开发的AI“化学家”Coscientist(一款基于GPT-4等大型语言模型的AI系统),竟能自主设计、规划和执行复杂的实验——不仅成功实现阿斯匹林、对乙酰氨基酚和布洛芬等药物分子的合成,甚至还在短短几分钟内优化了「钯催化交叉偶联反应」。

而「钯催化交叉偶联反应」正是2010年诺贝尔化学奖获得者的获奖研究,该反应能够高效地构建碳-碳键,生成很多以往难以甚至无法合成的物质。

Coscientist的出现不可谓不重磅,甚至可以说是颠覆了整个化学领域!连领导这项研究的CMU化学家Gabe Gomes都称,“当我看到一种非有机智能能够自主计划、设计和执行人类发明的化学反应的那一刻,真是太神奇了!”

图片

https://doi.org/10.1038/s41586-023-06792-0

回溯2023年,「ChatGPT」毫无疑问地当选年度热词之一。2022年底,OpenAI推出了基于大型语言模型(LLM)的聊天机器人ChatGPT以来,迅速发展并成功运用于多个领域,包括自然语言、生物和化学,以及代码生成。

随着迄今为止能力最强的LLM——GPT-4的问世,这波浪潮也席卷到了化学领域。于是,CMU研究团队基于多个LLM搭建起了AI系统Coscientist,这个AI“化学家”能够使用工具浏览互联网以及相关文件,使用机器人实验应用编程接口(APIs),并利用其他LLMs完成各种任务,实现自主设计、规划和执行真实世界的化学实验。

正如Gomes所述,“Coscientist可以做真正训练有素的化学家可以做的大部分事情”。

剖析其运作系统,Coscientist共包含5个模块——“大脑”规划者(Planner)和“四肢”网络搜索(Web searcher)、代码执行(Code execution)、文件检索(Docs searcher)和自动操作(Automation)。

图片

Coscientist的运作系统

规划者(Planner),即主模块,是整个系统的智能中枢,能够根据用户输入的内容,调用和协调其他模块来规划和推进整个实验。“大脑”能够给下面的四个模块下达指令,包括GOOGLE、PYTHON、DOCUMENTATION和EXPERIMENT。

网络搜索(Web searcher)会接收到来自Planner的GOOGLE指令,负责在互联网中检索实验相关信息,而该模块本身也是个LLM。

代码执行(Code execution)会接收到来自Planner的PYTHON指令,提供一个独立的python执行环境,为接下来的实验做准备。

文件检索(Docs searcher)会接收到来自Planner的DOCUMENTATION指令,主要负责进行文本检索和文档理解,能够为主模块提供有用的信息,比如提供实验参数以及操作细节等文档。

自动操作(Automation)会接收到来自Planner的EXPERIMENT指令,也就是最终的实验执行环节。该模块能够将控制中枢下发的实验方案转换为设备控制代码,根据DOCUMENTATION描述的API来自动化控制实验设备,完成实验操作。

百说不如一练,这个最新研发出来的AI“化学家”Coscientist的表现究竟如何?

为了测试其在已知化合物的化学合成上的真实能力,研究者要求Coscientist自行通过网络搜索,来完成多种药物分子的合成。并对比了OpenAI的GPT-3.5和GPT-4、Anthropic的Claude 1.3和Falcon-40B-Instruct等不同模型的能力。

图片

Coscientist在化学合成方面的能力

结果显示,基于GPT-4的网络搜索能够有效地改善合成化合物的规划,并在对乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的合成实验中获得了最高分。

而在合成布洛芬的实验中,GPT-4可谓是“一枝独秀”,是唯一一个能够达到最低可接受分数的模型。但由于该化合物的广泛性,对于AI们来说,这也是难度最大的“挑战”。

当然,研究者并不满足于“研究生水平”,而直接将考验难度拉满至“诺奖级别”——「钯催化交叉偶联反应」——即Coscientist需要使用互联网上提供的数据,进行必要的计算,并最终为液相工作站编写代码,实现整个化学实验的设计和开展。

图片

Coscientist设计和执行钯催化交叉偶联反应的过程

研究团队为Coscientist配备了液体处理装备以及多种试剂的储备溶剂,要求其在现有的资源下,成功设计并开展Suzuki–Miyaura偶联反应Sonogashira偶联反应。这两类反应在药物研发中发挥着重要作用,经常被用于生成碳-碳键。

Coscientist的表现令人惊喜!这个AI“化学家”首先在互联网上检索了反应物、反应剂量以及反应条件相关的所有信息,并对移液机器人进行了自助编程来开启反应。整个过程只用了不到4分钟的时间!

在运行的过程中,Coscientist会不断地对自己的策略进行调整。即使在过程中发生了错误,Coscientist也能及时查阅文献并更正版本,最终成功运行整个实验。

气相色谱-质谱分析显示,两个反应均形成了目标产物——在Suzuki–Miyaura偶联反应中,9.53分钟时出现了一个信号,与联苯的质谱相吻合;而在Sonogashira偶联反应中,研究者在12.92分钟时观测到一个信号,其分子离子质量电荷比与联苯相吻合。

没错,Coscientist成功地完成了考验!

图片

最终得到的“钯催化交叉偶联反应“结果

事实上,除了上述提到的“利用公开数据实现已知化合物的化学合成”和“处理需要同时使用多个硬件模块和整合不同数据源的复杂科学任务”之外,Coscientist还能够实现“高效搜索和浏览大量硬件文档”、“使用文档在云实验室中执行高级命令”、“使用底层指令精准控制液体处理仪器”和“解决需要分析以前收集的实验数据的优化问题”,且有着优越的表现。

可以预见的是,AI系统Coscientist的诞生将对化学和药学研究带来革命性的影响!未来,人类将有潜力利用AI来提高实验结果的可复制性和可靠性,进而促进科学发现的速度和数量。

Gomes表示,包括Coscientist在内的人工智能辅助系统的更为重要的意义在于,它们显著降低了几乎任何领域的准入门槛。试想一个,一个从未接触过钯催化交叉偶联反应的生物学家,想要以一种新的方式来探索反应的用途,Coscientist就可以派上用场并帮助其完成实验。

畅想一下,能够开展医学实验的AI系统也近在咫尺了吧?

参考资料:

Boiko, D.A., MacKnight, R., Kline, B. et al. Autonomous chemical research with large language models. Nature 624, 570–578 (2023). https://doi.org/10.1038/s41586-023-06792-0

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2177692, encodeId=7a3721e769238, content=<a href='/topic/show?id=92628e70534' target=_blank style='color:#2F92EE;'>#药物合成#</a> <a href='/topic/show?id=a2c0221380' target=_blank style='color:#2F92EE;'>#AI系统#</a> <a href='/topic/show?id=c751105068f0' target=_blank style='color:#2F92EE;'>#chatGPT#</a> <a href='/topic/show?id=f74010932204' target=_blank style='color:#2F92EE;'>#钯催化交叉偶联反应#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=23, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=2213, encryptionId=a2c0221380, topicName=AI系统), TopicDto(id=105068, encryptionId=c751105068f0, topicName=chatGPT), TopicDto(id=87705, encryptionId=92628e70534, topicName=药物合成), TopicDto(id=109322, encryptionId=f74010932204, topicName=钯催化交叉偶联反应)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Thu Dec 28 09:32:17 CST 2023, time=2023-12-28, status=1, ipAttribution=上海)]