纳米孔材料是一类具有纳米尺度孔隙的特殊材料,其显著特点包括高比表面积、高孔隙率和可定制的孔径分布等。纳米孔材料可分为两大类:纳米孔阵列材料和纳米多孔材料。
纳米孔阵列材料具有规则的结构,例如铝阳极氧化膜、硅纳米孔阵列和氧化锌纳米孔阵列等。这些材料具有独特的光学、电学和传感性能,广泛应用于光学器件、电子器件和生物传感器等领域。
图1. 纳米孔材料
纳米孔材料具有很强的吸附作用。这主要归因于它的表面积很大,使得更多的分子或原子能够与吸附物发生作用。此外,这些材料的孔壁提供了各种吸附点,如静电位点、氢键点、离子交换位点等,使其能够与吸附物产生不同类型的吸附作用,如范德华力、静电作用、π-π作用、疏水相互作用、氢键作用、离子/配体交换、路易斯酸碱相互作用、还原/氧化等。
这一吸附特性为纳米孔材料在许多领域的应用提供了广阔前景。例如,它们可以用于测量氢气存储装置的浓度,吸收火力发电站废气中的二氧化碳,检验有毒气体和爆炸物,以及分离DNA/RNA等。如图2所示,两种不同的分子输入到纳米孔材料中,但只有一种能够通过,另一种则被吸附。
图2. 纳米孔阵列材料吸附作用,阻碍特定分子通过
图3. 共价有机框架 (COF) 在同一拓扑结构下的两种形式
(左) COF-366 和 (右) COF-66
纳米孔材料的结构千变万化(如上图3所示),选择一种最符合特定要求的结构往往需要耗费大量的人力和时间。为此,研究者提出了利用人工智能来帮助我们进行筛选。研究者预先训练一个预测模型,将材料的孔径、表面积、孔密度、碳比例等特征作为输入,用这些特征来预测所有材料的吸附能力。这是一种离线建模方法,其挑战在于需要大量的实验样本来训练预测模型。
近年来,出现了一种在线学习的方法,该方法让人工智能系统指导我们一步步找到最优的材料结构,从而减少了离线建模方法对大量数据的需求[1]。如图4所示,这个过程首先是选择一个材料进行实验,得到它的吸附能力。然后,将这一实验结果作为数据,更新AI模型。基于更新后的模型,选择下一个需要验证的结构,得到它的吸附能力。这一结果再次作为新数据更新AI模型。通过重复上述过程,就可以在较低的实验成本下探索出具有最佳吸附能力的材料。
特别重要的是,AI模型在对每种材料进行预测时都会考虑一个“不确定性”因素,这样在选择材料时,既考虑预测的吸附能力,也考虑预测的不确定性。对于那些预测不确定性较高的材料,通过进行更多的验证,来兼顾探索过程的有效性和全面性。这一过程称为贝叶斯优化方法。
图4. 基于贝叶斯优化方法的结构选择
具体地,文章[1]中介绍了一种称为高斯过程 (Gaussian Process, GP) 的非参数概率模型,如图5所示。这一模型假设任意有限个结构的吸附能力值均服从一个联合高斯分布。基于这一假设,给定N个结构的吸附能力值,任意一个新结构的吸附能力值都可以用一个高斯分布 N(μ,σ^2) 来表示,其中 μ 表示吸附能力的预测值, σ^2 为这一预测值的方差。在选择第N+1个要验证的结构时,模型会考虑 μ 和 σ 都比较大的结构,这样就既能选择那些具有更好吸附效果的结构,同时也不会遗忘那些尚未被完全确认的结构。
图5. 高斯过程示意图
蓝色实线表示预测结果,蓝色阴影面积表示预测方差 (不确定性),黑色十字表示观察样本 (即已被验证的结构)。可以看到,越是没有被观察样本覆盖的区域,预测方差越大。
图6是一个实验结果,实验数据包含6.9万个共价有机框架 (COF) 结构。其中,横轴代表了已验证材料的个数,纵轴是所有已验证材料中的最大吸附值。黄色曲线 (random search) 是随机选择的结果,绿色和灰色的点代表非在线学习方法,红色曲线 (CMA-ES) 是用遗传算法的选择结果 (另一种在线学习方法,通过已验证过的最优材料生成下一次实验的候选),蓝色曲线 (BO) 是贝叶斯优化方法的结果。可以看到,贝叶斯优化方法通过少量实验 (100次) 即可得到最优结构 (黑色虚线),极大节省了实验成本,并且表现优于其他AI方法。
图6. 贝叶斯优化方法与其他AI方法的对比
参考文献:
[1] Deshwal A, Simon C M, Doppa J R. Bayesian optimization of nanoporous materials[J]. Molecular Systems Design & Engineering, 2021, 6(12): 1066-1086.
By:清华大学 王东