跳动百科

机器学习用于预测复杂新材料的合成

童乐玲
导读 科学家和机构每年都投入更多资源来发现新材料,为世界提供燃料。随着自然资源的减少以及对更高价值和先进性能产品的需求增长,研究人员越来

科学家和机构每年都投入更多资源来发现新材料,为世界提供燃料。随着自然资源的减少以及对更高价值和先进性能产品的需求增长,研究人员越来越多地关注纳米材料。

纳米粒子已经找到了进入从能量存储和转换到量子计算和治疗等应用的方法。但是,鉴于纳米化学具有广泛的成分和结构可调性,识别新材料的连续实验方法对发现施加了不可逾越的限制。

现在,西北大学和丰田研究所 (TRI) 的研究人员已成功应用机器学习来指导新纳米材料的合成,消除与材料发现相关的障碍。训练有素的算法通过定义的数据集来准确预测可以为清洁能源、化学和汽车行业的过程提供燃料的新结构。

“我们让模型告诉我们,多达七种元素的混合物会产生哪些以前从未制造过的东西,”西北纳米技术专家、该论文的通讯作者 Chad Mirkin 说。“机器预测了 19 种可能性,在对每种可能性进行了测试后,我们发现其中 18 种预测是正确的。”

这项名为“多元素异质结构的机器学习加速设计和合成”的研究将于 12 月 22 日发表在《科学进展》杂志上。

Mirkin 是温伯格文理学院的 George B. Rathmann 化学教授;麦考密克工程学院化学与生物工程、生物医学工程、材料科学与工程教授;和范伯格医学院的医学教授。他还是国际纳米技术研究所的创始主任。

绘制材料基因组

根据 Mirkin 的说法,之所以如此重要,是因为可以访问前所未有的大而优质的数据集,因为机器学习模型和 AI 算法只能与用于训练它们的数据一样好。

这种名为“Megalibrary”的数据生成工具由 Mirkin 发明,极大地扩展了研究人员的视野。每个 Megalibrary 都包含数百万甚至数十亿个纳米结构,每个纳米结构的形状、结构和成分都略有不同,所有这些都在 2×2 平方厘米的芯片上进行了位置编码。迄今为止,每个芯片包含的新无机材料比科学家收集和分类的要多。

Mirkin 的团队通过使用一种称为聚合物笔光刻的技术(也由 Mirkin 发明)开发了 Megalibraries,这是一种大规模并行纳米光刻工具,能够每秒对数十万个特征进行特定位置的沉积。

在绘制人类基因组图谱时,科学家的任务是识别四种碱基的组合。但松散同义的“材料基因组”包括元素周期表中任何可用的 118 种元素的纳米粒子组合,以及形状、大小、相形态、晶体结构等参数。以 Megalibraries 的形式构建更小的纳米粒子子集将使研究人员更接近完成材料基因组的完整图谱。

Mirkin 说,即使是类似于材料“基因组”的东西,确定如何使用或标记它们也需要不同的工具。

“即使我们可以比地球上任何人更快地制造材料,那仍然是可能性海洋中的一滴水,”米尔金说。“我们想定义和挖掘材料基因组,我们这样做的方式是通过人工智能。”

机器学习应用程序非常适合解决定义和挖掘材料基因组的复杂性,但受限于创建数据集以在空间中训练算法的能力。Mirkin 表示,Megalibraries 与机器学习的结合可能最终会解决这个问题,从而了解哪些参数会驱动某些材料特性。

“化学家无法预测的材料”

如果 Megalibraries 提供地图,则机器学习提供图例。

Mirkin 表示,使用 Megalibraries 作为用于训练人工智能(AI) 算法的高质量和大规模材料数据的来源,使研究人员能够摆脱通常伴随材料发现过程而来的“敏锐的化学直觉”和连续实验。

“西北大学拥有合成能力和最先进的表征能力来确定我们生成的材料的结构,”米尔金说。“我们与 TRI 的 AI 团队合作,为 AI 算法创建数据输入,最终对化学家无法预测的材料做出这些预测。”

在这项研究中,该团队编译了先前生成的由具有复杂成分、结构、尺寸和形态的纳米粒子组成的 Megalibrary 结构数据。他们使用这些数据来训练模型,并要求它预测会产生某种结构特征的四个、五个和六个元素的组成。在 19 次预测中,机器学习模型正确预测了 18 次新材料——准确率约为 95%。

由于对化学或物理学知之甚少,仅使用训练数据,该模型就能够准确预测地球上从未存在过的复杂结构。

“正如这些数据所表明的,机器学习的应用,结合 Megalibrary 技术,可能是最终定义材料基因组的途径,”TRI 的高级研究科学家 Joseph Montoya 说。

金属纳米粒子显示出催化工业关键反应的前景,例如析氢、二氧化碳 (CO 2 ) 还原和氧还原和析出。该模型在西北大学建立的大型数据集上进行了训练,以寻找具有围绕相位、尺寸、尺寸和其他结构特征设置参数的多金属纳米粒子,这些参数会改变纳米粒子的特性和功能。

Megalibrary 技术还可能推动对未来至关重要的许多领域的发现,包括塑料升级回收、太阳能电池、超导体和量子比特。

随着时间的推移效果更好的工具

在大型图书馆出现之前,机器学习工具是根据不同人在不同时间收集的不完整数据集进行训练的,这限制了它们的预测能力和普遍性。大型图书馆允许机器学习工具做他们最擅长的事情——随着时间的推移学习并变得更聪明。Mirkin 说,他们的模型只会在预测正确的材料方面变得更好,因为它在受控条件下收集了更多高质量的数据。

“创造这种人工智能能力是为了能够预测任何应用所需的材料,”蒙托亚说。“我们拥有的数据越多,我们的预测能力就越大。当你开始训练 AI 时,你首先将它本地化到一个数据集上,随着它的学习,你会不断添加越来越多的数据——这就像带着孩子和从幼儿园到博士学位。经验和知识的结合最终决定了他们能走多远。”

该团队现在正在使用该方法寻找对清洁能源、汽车和化工行业的燃料过程至关重要的催化剂。确定新的绿色催化剂将使废物和大量原料转化为有用物质、氢气产生、二氧化碳利用和燃料电池的开发。生产催化剂还可用于替代昂贵且稀有的材料,如铱,这是用于产生绿色氢气和 CO 2还原产物的金属。