富士通とマサチューセッツ工科大学 Center for Brains, Minds and Machines、未知のデータを高精度に認識できるAI技術を開発

2021/12/9

Today's PICK UP

富士通株式会社とマサチューセッツ工科大学 Center for Brains, Minds and Machines（以下、CBMM）は、学習時と傾向の大きく異なる未知（out-of-distribution、以下、OOD）のデータに対しても、AIが高い認識精度を示す技術を共同で開発したと発表した。

Contents

■背景と課題
■共同開発した技術

近年、AIはディープニューラルネットワーク（以下、DNN）の登場により、製造業における不良品検知や医療における画像診断など幅広いシーンで応用され始め、人と同等以上の性能を発揮する一方で、学習時には想定していなかった照明や視点などの環境や条件の変化により見え方に大きな違いが生じると、認識精度が大幅に低下するという課題があるという。

今回、両者は、人の認知特性と脳の構造に着想を得て、DNNを形や色などの属性ごとのモジュールに分割して学習させることで、AIがOODデータを高精度に認識する技術を開発。本技術を適用したAIを、画像認識精度を測る標準ベンチマーク「CLEVR-CoGenT」で評価した結果、世界一の精度を達成したという。

今後、本技術の活用により、様々な観測条件の変化に対応できる交通監視AIや、多種多様な病変を正しく認識できる画像診断AIなどの実現が期待されるとのことだ。

■背景と課題

近年、DNNを利用した機械学習技術の発展により、人に匹敵する高い認識精度を持つAIの構築が可能となっている。しかし、少ない情報で物事を幅広く把握できる人とは異なり、OODデータのように未知のデータに対しては、AIの認識精度が大幅に低下するという課題があったという。また、同じ物でも色合いや角度など条件の異なる様々なデータを網羅的に学習させることは難しく、認識精度の向上には限界があったとのことだ。

■共同開発した技術

今回、富士通とCBMMは、人の持つ認知特性と脳の構造に着想を得て、AIがOODデータを高精度に認識できる技術を開発した。本技術は、人が物を認知する際に形や色などの見え方に違いがあっても、それらの視覚情報を脳内で正確に捉えて分類できることに着目し、複数の画像データをDNNに入力した際に生じるニューロンにおける対象物の見え方と分類の反応から独自の指標を算出し、本指標の数値が高くなるようにDNNの学習を促進させることで、AIの認識精度を向上させるものだ。具体的には、従来、DNNを分割せず一つのモジュールで学習させることが認識精度の高いAIを実現する最良の手法だと考えられていたが、今回算出した指標に基づき、DNNを物の形や色などの属性ごとのモジュールに分割して学習させることで、より認識精度が高いAIを実現したとのことだ。