早稲田大学、材料科学のデータを単一のAIに学習させる手法を開発　背景知識を与え「AIの経験と勘を磨く」ことを目指す

2020/7/31

Today's PICK UP

早稲田大学理工学術院の畠山歓講師および小柳津研一教授の研究グループは、多彩な形式の材料科学のデータを単一の人工知能（以下、AI）に学習させる手法を開発した。

Contents

■これまでの研究で分かっていたこと
■今回の研究で新たに実現しようとしたこと、明らかになったこと
■そのために新しく開発した手法
■研究の波及効果や社会的影響

これまで材料科学で使われるAIの予測モデルは原則として1つの形式や概念しか学習することができなかったが、本手法の導入により、単一のAIに40種類以上の物性、数千以上の化合物、数百以上のプロセス情報を学習・予測させ、材料科学に関する広範な知識をAIに付与することができたという。今後、材料科学に限らず創薬など広範な分野に応用可能な“万能AI”を導く一つの道筋となる可能性があるとのことだ。本研究成果は、2020年7月30日（木）午前10時（英国時間）にNature系列誌『Communications Materials』のオンライン版で公開された。

■これまでの研究で分かっていたこと

近年のAI技術の進歩を背景に、これを革新材料の探索に応用する研究が世界中で進められている（マテリアルズ・インフォマティクス、以下MI）。人類が蓄積してきた膨大な研究データをAIに学習させ、人知を超えた材料設計を提案してもらうことが、MIの究極目標の一つだという。しかしながら、現在のAIは“知能”と呼ぶにはほど遠い水準だ。

課題の一つは、材料科学で使われるAIの予測モデルは原則として1つのデータベースや概念しか学習出来ない点だった。ヒトは多彩な分野（言語、数学、化学、物理、人文、社会科学など）を知識として取り入れ、それらを統合した上で総合的な判断を下すことが出来る。一方、AIに対して異なる概念を学習させるのは容易ではない。例えば化合物の融点と沸点の間に正の相関があることは良く知られており、ヒトは“高融点の化合物は沸点も高いはずだ”、という予測を立てられる。しかしながら、従来のAIは融点または沸点のみを学習するケースがほとんどで、複数の物性を同時学習させることが大変困難だったとのことだ。

出典元：プレスリリース

■今回の研究で新たに実現しようとしたこと、明らかになったこと

多彩な材料データベースや異なる物性値を単一の学習モデルに認識・学習させ、材料科学に関する広範な知識をAIに付与する作業に挑戦したという。

■そのために新しく開発した手法

グラフ構造と呼ばれるフォーマットに着眼し、種々のデータベースを共通書式に変換する手法を開発。従来の材料データベースはExcelのような表形式で記述されるケースが大半だったが、通常の学習モデルは単一の構造の表形式データしか受け付けないため、異種データベースの学習が困難だった。一方、本研究では全データを共通書式のグラフ構造に変換し、専用の学習モデルに入力することで、原理的にあらゆるデータベースを学習可能にしたとのことだ。

新規手法の導入により、単一のAIで40種類以上の物性、数千以上の化合物、数百以上のプロセス情報を学習・予測させることが出来た。特筆すべき例は、透明ディスプレイ等への応用も期待されるPEDOT-PSSと呼ばれる導電性ポリマーの性能予測だという。ポリマーフィルムの製法の微妙な違いにより導電性が1万倍以上も増減してしまう材料だが、AIはフィルムの製法をもとに導電性を化学実験の熟練者並の精度で予測出来たとのことだ。

出典元：プレスリリース

■研究の波及効果や社会的影響

MIのボトルネックはデータ収集だという。深層学習には数万件以上のデータが必要とも言われるが、一般的な研究室では数十～数百回程度の実験回数が現実的だ。この大きなギャップを埋めるのが異種データベースの同時学習と考えるとのことだ。例えばWikipediaのような膨大な公知のビッグデータ中にある多彩な化合物の情報を入力し、“化学の知識を身につけさせ”つつ、目的のデータベースと同時学習させることで、後者の学習精度を上げられることが分かっている。種々の分野の多彩な背景知識を与えて“AIの経験と勘を磨く”という手法は、材料科学に限らず創薬など広範な分野に応用可能な、“万能AI”を導く一つの道筋となる可能性があるという。