化学家们的工作很辛苦,为了发明一种新物质,往往需要长时间泡在实验室里,耗费大量实验材料。不少实验还有腐蚀性、毒性,甚至爆炸的可能。
为了帮助化学家做实验,人工智能的专家们已经做了很多工作。比如,最早的专家系统Dendral就是用来帮助化学家们分析分子的拓扑结构[1]。近年来,人工智能技术在化学领域广泛应用,出现了各种工具,在很多方面提高了化学家们的工作效率,比如化学反应预测[2]、逆向合成设计[3]、分子特性预测[4]、新分子合成[5]、反应过程优化[6]等。这些工具非常强大,但要用好它们并不容易。一方面,它们学习起来较为复杂;另一方面,如何把它们结合起来以达到最佳效果并不知道。
近年来,大语言模型(LLM)技术迅猛发展,展现出极强的推理和规划能力。这启发了科学家们的思考:是不是可以让大语言模型来操作这些工具,从而代替人来完成化学实验呢?
拿到这个任务后,大语言模型开始规划如何合成一种杀虫剂[7]。它可能需要调用搜索工具查找资料设计反应方程,利用反应预测工具预测生成的化合物,或利用属性预测工具检查该化合物是否真能杀虫。通过这些工具,大语言模型会设计出若干杀虫剂的制作方案并交给自动实验室去加工,并检查加工的结果是否符合预期。如果达不到预期,再重新尝试生成。在这一过程中,大语言模型就像一个大脑,指挥着各种工具有条不紊地完成自己的工作,直到完成“合成杀虫剂”的任务。
文章作者报告称,通过这种方法,他们不仅成功合成了预想中的杀虫剂,还合成了三种有机催化剂,并发现了一种新的发色团(分子中显现颜色的成分)。将大语言模型和外部工具结合起来,完成更复杂的工作,并对物理世界产生影响,成为当前人工智能研究的一个重要方向。
参考文献:
[1] https://web.mit.edu/6.034/www/6.s966/dendral-history.pdf
[2] Coley C W, Barzilay R, Jaakkola T S, et al. Prediction of organic reaction outcomes using machine learning[J]. ACS central science, 2017, 3(5): 434-443.
[3] Szymkuć S, Gajewska E P, Klucznik T, et al. Computer‐assisted synthetic planning: the end of the beginning[J]. Angewandte Chemie International Edition, 2016, 55(20): 5904-5937.
[4] Yang K, Swanson K, Jin W, et al. Analyzing learned molecular representations for property prediction[J]. Journal of chemical information and modeling, 2019, 59(8): 3370-3388.
[5] Gómez-Bombarelli R, Wei J N, Duvenaud D, et al. Automatic chemical design using a data-driven continuous representation of molecules[J]. ACS central science, 2018, 4(2): 268-276.
[6] Shields B J, Stevens J, Li J, et al. Bayesian reaction optimization as a tool for chemical synthesis[J]. Nature, 2021, 590(7844): 89-96.
[7] M. Bran, A., Cox, S., Schilter, O. et al. Augmenting large language models with chemistry tools. Nat Mach Intell 6, 525–535 (2024). https://doi.org/10.1038/s42256-024-00832-8
供稿:清华大学 王东
制作:北京邮电大学 戴维
审核:北京邮电大学 李蓝天