11 月,谷歌的人工智能公司 DeepMind 发布了一篇新闻稿,题为 "利用深度学习发现了数百万种新材料。"但现在,分析了 DeepMind 发现的一个子集的研究人员表示,"我们尚未在该子集中发现任何引人注目的新化合物"。
"人工智能工具 GNoME 发现了 220 万种新晶体,其中包括 38 万种可为未来技术提供动力的稳定材料,"谷歌在谈到这一发现时写道,并补充说,这 "相当于近 800 年的知识价值",其中许多发现 "超越了人类以往的化学直觉",而且 "是人类已知稳定材料数量级的扩展"。该论文 发表在Nature 上,并被被媒体广泛报道,作为人工智能在科学领域令人难以置信的前景的一个例子。
另一篇论文,同时发表的论文,由劳伦斯伯克利国家实验室的研究人员 "与谷歌 DeepMind 合作完成......展示了如何利用我们的人工智能预测进行自主材料合成,"谷歌写道。在这项实验中,研究人员创建了一个 "自主实验室"(A-Lab),利用 "计算、文献中的历史数据、机器学习和主动学习来规划和解释利用机器人技术进行的实验的结果"。从根本上说,研究人员利用人工智能和机器人将人类从实验室中移除,17天后从另一端出来,发现并合成了新材料,研究人员写道,这 "证明了人工智能驱动平台在自主材料发现方面的有效性"。
《化学材料》一书中的示意图,说明了什么应该构成一种新材料。
但是在上个月,两组外部研究人员对 DeepMind 和伯克利的论文进行了分析,并发表了他们自己的分析报告,这些报告至少表明这项特定的研究被夸大了。与我交谈过的材料学界的每个人都强调,人工智能在发现新型材料方面大有可为。但他们表示,谷歌及其深度学习技术并没有突然在材料科学领域取得令人难以置信的突破。
Chemical Materials 本周,加利福尼亚大学的 Anthony Cheetham 和 Ram Seshadri、圣塔芭芭拉大学的 Anthony Cheetham 和 Ram Seshadri 从 DeepMind 发布的 38 万个拟议结构中随机抽取了一个样本,并表示这些结构都不符合拟议材料是否 "可信"、"有用 "和 "新颖 "的三项测试标准。"他们认为,DeepMind 发现的是 "结晶无机化合物,应该这样描述,而不是使用更通用的标签'材料'",他们说,"材料 "这个词应该保留给那些 "显示出某种实用性 "的东西。
在分析报告中,他们写道:"我们尚未在 GNoME 和稳定结构列表中发现任何引人注目的新化合物,尽管我们预计在 384,870 个化合物中一定会有一些。我们还注意到,虽然许多新成分是对已知材料的微不足道的改编,但计算方法提供了可信的总体成分,这让我们相信基本方法是合理的。
"most of them might be credible, but they're not very novel because they are simple derivatives of things that are already known"
在一次电话采访中,Cheetham 告诉我:"谷歌的这篇论文远远没有为实验材料科学家做出有用、实用的贡献"。Seshadri 说:"我们实际上认为,谷歌在这方面没有做到位。"
"如果我正在寻找一种新材料来实现某种特定功能,我不会像 Google 建议的那样梳理 200 多万种新构成,"Cheetham 说。"我认为这不是向前迈进的最佳方式。我认为一般的方法可能效果很好,但需要更加专注于具体的需求,所以我们都没有足够的时间去研究 220 万种可能性,并决定这些可能性有多大用处。我们为此花费了大量时间来研究他们提出的一小部分内容,我们发现这些内容不仅没有任何功能性,而且其中大部分内容可能是可信的,但它们并不新颖,因为它们只是已知内容的简单衍生物。"
Google DeepMind 在一份声明中告诉我:"我们坚持 Google DeepMind 的 GNoME 论文中的所有说法。"
"我们的 GNoME 研究代表了比科学界以前已知的候选材料更多数量级的材料,我们预测的数百种材料已经被世界各地的科学家独立合成。材料项目是open-access 材料属性数据库发现,与其他机器学习模型相比,谷歌的 GNoMe 数据库堪称一流、谷歌表示,"化学材料 "分析报告中的一些批评意见,例如许多新材料的结构已经为人所知,但却使用了不同的元素,都是 DeepMind 设计的。
同时,伯克利的论文声称,一个 "自主实验室"(名为 "A-Lab")采用了另一个名为 "材料项目 "的项目提出的结构,并在没有人工干预的情况下使用机器人进行合成,创造出了 43 种 "新型化合物"。这篇论文中有一位 DeepMind 的研究人员,谷歌也在新闻稿中对其进行了宣传,但谷歌并没有主动做这项实验。
人类研究人员 分析这一发现发现,它也存在问题:"我们讨论了所有 43 种合成产品,并指出了分析中常见的四个缺陷。普林斯顿大学的莱斯利-肖普和伦敦大学学院的罗伯特-帕尔格雷夫等作者在分析报告中写道:"不幸的是,这些错误导致我们得出结论,即这项工作没有发现新材料。
另外,与我交谈过的四位研究人员都表示,他们相信人工智能引导的寻找新材料的过程大有可为,但他们表示,他们分析的具体论文并不一定是巨大的突破,不应该把它们理解为巨大的突破。
"在 DeepMind 的论文中,有许多预测材料的例子显然是无稽之谈。帕尔格雷夫告诉我:"不仅是学科专家,大多数高中生都会说,像 H2O11 这样的化合物(这是 Deepmind 预测的)看起来不对。帕尔格雷夫告诉我:"还有很多其他明显错误的化合物例子,Cheetham/Seshadri做得很好,比我在这里做得更有说服力。在我看来,基本的质量控制似乎并没有做到位--ML 输出这样的化合物作为预测结果是令人震惊的,在我看来,这说明出了问题。"
人工智能已被用于在互联网上充斥大量人类无法轻松解析的内容,这使得发现人类生成的高质量作品成为一项挑战。这是一个不完美的类比,但与我交谈过的研究人员说,类似的情况也可能发生在材料科学领域:巨大的潜在结构数据库并不一定能让我们更轻松地创造出对社会产生积极影响的产品。
"了解数以百万计的材料(如果准确的话)是有一些好处的,但您如何在这个空间中寻找有用的材料进行制造呢?"帕尔格雷夫说:"知道几种具有特别有用特性的新化合物,总比不知道哪种是好材料要好。
Schoop 说,已经有 "5 万种独特的晶体无机化合物,但我们只知道其中一小部分的性质。因此,我不太明白,如果我们还不了解所有已知的化合物,为什么还需要数百万种化合物。预测材料的特性可能比简单地预测新材料更有用"。
尽管如此,Google DeepMind 仍表示坚持其论文的观点,并对这些定性持有异议、这些发现应该如何进行背景分析、测试并付诸行动,以及向世界倾销巨大的拟议结构数据库是否真的会为社会带来新的、切实的突破,还是只会制造大量噪音。
"我们不认为人工智能从根本上存在问题,"Seshadri 说。"我们认为这是一个如何使用的问题。我们不是那种认为这些技术在我们的科学中没有用武之地的老古董。"