映像をAIで解析し臨場感を伝える「感情表現字幕システム」が開発
2020/8/25
大日本印刷株式会社(以下、DNP)は、株式会社NHKテクノロジーズ(以下、NT)と共同で、映像と音声をAI(人工知能)で解析し、内容や感情に合わせた最適なイメージのフォントで字幕を表示する「感情表現字幕システム」のプロトタイプを開発したと発表した。本システムは、2018年にDNPが開発した文章の内容に合うフォントを自動で判別して表示する「DNP感情表現フォントシステム」を活用している。これにより、耳の不自由な人や音が出せない環境でも、番組の臨場感を伝えることができる。
Contents
■「感情表現字幕システム」開発の背景
■「感情表現字幕システム」の特長
録画やライブ(生放送)の音声を解析して、リアルタイムで字幕を自動的に付与する。その際、字幕の内容や発話者の表情を解析して感情を把握し、その感情の表現に最適なフォントを12種類の中から自動で選んで字幕に使用する。例えば、楽しい内容は丸みのあるフォントで、怒っている内容は角ばったフォントで表示することで、より直感的に内容を伝える。
2.映像内の人物の顔を認識して、発話者の口元の近くに字幕を自動的に表示
映像内の発話者を特定して、自動的にその口元の近くに字幕を表示することができる。これにより、複数の人物が登場する映像でも、誰が何を話しているかを直感的に伝えることができる。
・12種類の感情・イメージと使用フォントの組み合わせ例(感情の分類やフォントは手動で変更可能)