富士通、人の複雑な行動を関節の位置や接続関係から高精度に認識できるAI技術を開発

株式会社富士通研究所は、映像による人の行動認識において、箱を開けて物品を取り出すなど、複数の関節が連動して動くような複雑な行動についても、隣り合う各関節の位置や接続関係を用い、深層学習で高精度に認識できる技術を開発したと発表した。

本技術は、行動認識分野における骨格データを用いた世界標準のベンチマークにおいて、隣り合う関節の情報を用いない従来技術の正解率を大きく上回り、世界最高精度を達成したという。同社は、本技術を工場での作業手順の確認や公共機関における危険行動の検知などに活用することで、安全性やサービスを大幅に改善するなど、安心安全な社会の実現に貢献していくとのことだ。

同社は、本技術の詳細を、2021年1月10日から2021年1月15日まで、オンラインで開催されている国際会議「25th International Conference on Pattern Recognition(以下、ICPR2020)」にて発表するという。

近年のAI技術の進歩に伴い、工場での作業手順の確認や公共機関における危険行動の検知などを目的に、深層学習によって映像から人の行動を認識できるようになりつつある。一般に、AIによる人の映像認識では、手や肘、肩などの骨格の各関節位置の時間的変化を特徴量として抽出し、立つ、座るなどの簡単な行動パターンと紐づけて認識していた。

今回開発した時系列行動認識技術では、箱を開けて物品を取り出す開梱作業など、複数の関節が連動して変化するような複雑な行動についても、深層学習のAIモデルによる高精度な認識を実現したとのことだ。

■開発した技術

開梱作業などの複雑な行動では、腕の曲げ伸ばしに伴い、手や肘、肩の関節が連動して動く。今回、関節位置をノード(頂点)として、人体の構造に基づいて隣り合う関節を結んだエッジからなるグラフを採用し、グラフ構造の畳み込み演算を行うグラフ畳み込みニューラルネットワークの新たなAIモデルを開発。本モデルを、あらかじめ関節の時系列データを用いて学習することで、隣り合う関節との接続強度(重み)が最適化され、行動の認識に有効な接続関係が獲得できるという。従来技術では関節ごとの個別の特徴を正確に捉える必要があったが、学習済みのAIモデルでは、連動する隣り合う関節を併せた特徴量が抽出でき、複雑な行動に対する高精度な認識を実現したとのことだ。
出典元:プレスリリース
本技術を行動認識分野における骨格データを用いた世界標準のベンチマークで評価したところ、公開データセットにおける、立つ、座るなどの単純な行動では、隣り合う関節の情報を用いない従来技術と同等の正解率を保ち、開梱作業、物を投げるなどの複雑な行動では正解率が大きく向上し、全体として7%以上も上回り世界一の認識精度を達成したという。
出典元:プレスリリース

Article Tags

Special Features

連載特集
See More