KDDI総合研究所、マスク着用時の表情認識AI技術を開発
2021/2/26
株式会社KDDI総合研究所は、マスクを着けている人でも、90%以上の精度でポジティブ・ニュートラル・ネガティブの表情を分析できる「顔領域適応型表情認識AI」を開発したと発表した。これにより、企業、教育機関、公共施設、イベント会場など、日常的にマスクを着用する場面で、人の表情を高精度に分析する新しいサービスの実現が期待されるという。
■背景
■今回の成果
■技術的特徴
・顔露出領域については、目の周辺領域の特徴量(例えば、表情は眉間にシワを寄せるなどに表れやすい)に加えて、検出顔のその他の領域(例えば、鼻・口・頬・顔面の筋肉の露出領域)も可能な限り活用。
・マスク着用領域についても、顔全体、特に鼻・口・頬における筋肉の変化によって、マスク自体にシワが生じて変形することとなるため、マスク着用領域の特徴量も学習。また、顔露出領域から認識された表情の特徴量と、マスク着用領域から認識された表情の特徴量との相関関係を得られるように、それぞれの特徴量の重要度を学習で数値化。
(2)顔露出領域及びマスク着用領域に対して、それぞれのニューラルネットワーク「顔露出領域特徴量抽出モデル」および「マスク領域特徴量抽出モデル」に入力し学習。中間層特徴量層は、ニューラルネットワークの最終段の中間層を可視化することで、それぞれの領域画像の特徴量を認識。
(3)顔露出領域及びマスク着用領域の相関関係を学習するため、中間特徴量融合層は、表情分類の教師ラベルに基づいて、下記により、「顔露出領域特徴量抽出モデル」および「マスク領域特徴量抽出モデル」のそれぞれの中間特徴量層毎に異なる重み(それぞれの中間特徴量層からの特徴量の重要度を数値化したもの)を学習で導出。
・顔露出領域入力中間層に対する重み :β
・マスク着用領域入力中間層に対する重み:1-β
実際の利用場面においては、中間特徴量融合層は、各中間層特徴量から出力された中間特徴量を重み付きで融合して、表情を推定する。これにより、顔露出領域とマスク着用領域を別々に分析しながら双方の相関関係も同時に考慮可能することで、マスクを着けている場合でも表情分析・推定処理の高精度化実現しているという。評価実験では、インターネットで収集したマスクを着用した検証データセットを用いて、今回の表情認識AIと従来技術との比較実験を行った結果、表情認識精度は90%以上に達成し、従来技術(58%)を大幅に上回る精度が実現できることを確認したとのことだ。