AIで音声を自分の外見に変換してオンライン会議ができる「xpression camera Voice2Face」がリリース

株式会社EmbodyMe(エンボディーミー)は、AIで音声を自分の外見に変換して、家事をしながらなど、どのような状況でもZoom会議などができる「xpression camera Voice2Face(エクスプレッションカメラボイストゥーフェイス)」をリリースしたと発表した。

同社はこれまで、Zoomなどのビデオ会議やYouTubeなどのライブ配信で、カメラで顔の表情や体の動きを読みとって、自分の外見をAIで置き換えてリアルタイムにコミュニケーションができる「xpression camera」を提供してきた。

これをさらに向上、発展させ、カメラがなくても音声だけを入力としてリアルタイムで映像を生成でき、さらにボタンをクリックするだけで、対面では実現できないような多彩な動きを生成し、より豊かな感情を表現できる新技術「Voice2Face」を開発し、大幅にリニューアルしたとのことだ。
出典元:プレスリリース
出典元:プレスリリース
出典元:プレスリリース
コロナ禍で、仕事、診療、教育、イベントなど社会的な活動の多くで、ビデオチャットなどの動画コミュニケーションが急速に普及した。しかし一方で、「対面に比べたコミュニケーションのとりづらさ」もあり、喫緊の課題となっているとのことだ。昨今メタバースが注目を集めている大きな理由は、こうした課題を、VRデバイスを使って対面での体験にできる限り近づけて解決しようとしているためだという。しかし、まだVRデバイスをほとんどの人が持っておらず、VRデバイスを長く装着することによる疲れの問題も解決されていないなど、普及にはまだ時間がかかると予想されているという。

「xpression camera」は「対面に比べたコミュニケーションのとりづらさ」を、メタバースのように対面での体験にそのまま近づけて解決しようとするのではなく、なぜ対面が優れているのかという根本の原因に立ち返り、それを対面とは違ったバーチャルならではの切り口で解決する。なぜ対面が優れているのかという原因には、「Zoom疲れ」という問題と、非言語情報や感情表現手段の不足があるという。「Zoom疲れ」はビデオチャットで心理的、身体的な疲労感を感じる現象のことで、常に自分の頭や視線の向きをカメラの方向に固定して小さい画面の中の他人と頻繁に目線を合わせなければならないことや、セルフビューが表示されているために他人から常に見られているように感じてしまうことによる緊張感が原因だという研究結果が出ているとのことだ。また、対面でのコミュニケーションと比べると、表情、身振り、手振りなどの非言語情報が伝わりづらいので、スムーズな意思疎通が図りづらく、特にオフィスでの雑談や、Zoom飲み会のような非言語情報がより重視されるカジュアルなコミュニケーションが、オンラインでは失われてしまっている。

「xpression camera」は、自分の写真など好きな画像を一枚用意するだけで、自分の表情や体の動きに応じてリアルタイムで映像を生成でき、自分の実際の姿を見せないため、自分がどう見られているか気にせずにコミュニケーションができる。さらに今回リリースする新技術「Voice2Face」は、カメラを使わずに音声から、リアルタイムで自分の外見を生成できるようになるため、リラックスした体勢、自由な環境でコミュニケーションすることが可能となり、Zoom疲れを軽減、解消することができる。子どもの面倒を見たり、家事をしながら、ジョギングをしながらなど、どのような状況でもビデオチャットができるようになる。
出典元:プレスリリース
また、ボタンをクリックするだけで、LINE のスタンプのように、対面のコミュニケーションではできないデフォルメされた動きも取り入れた豊かな感情表現を、画面上の自分の映像やアバターを通じて実現できるようになる。このことにより、LINEのスタンプがテキストによるコミュニケーションに非言語情報である感情表現をもたらしたように、動画コミュニケーションに新たな感情表現をもたらし、新しいコミュニケーションを生み出す。
出典元:プレスリリース

Article Tags

カテゴリ

Special Features

連載特集
See More