「AIを活用したMOOC講座」は、講師が話している数分程度の動画と、テキストデータから生成した音声データをもとにAIで講師動画を生成することで、講座をまるで講師本人が話しているように再現する。音声合成技術を有するNTTテクノクロスと、AIによる人物動画生成技術を有するデータグリッドの最先端技術を活用して講義動画を生成し、オンライン学習動画サービス「gacco(ガッコ)」を運営するガッコが株式会社NTTドコモ(以下、ドコモ)と連携して講座の提供を行っている。
本講座は、NTTテクノクロスの音声合成サービス「FutureVoice Crayon(フューチャーボイス クレヨン)」を活用して、テキストデータから講座内の音声データを生成する。テキストデータを「FutureVoice Crayon」にインプットすることで、人間の声と遜色ない自然な音声データが生成される。次に、データグリッドのAIによる人物動画生成技術により、音声データと数分程度の講師動画をもとに、音声に口の動きを合わせ、講師本人が話しているような長尺の講義動画を自動的に生成する。この技術は、少数のデータで精度の高いデータ生成が可能なGAN(Generative Adversarial Network / 敵対的生成ネットワーク)により実現している。
【講座名】AIの基礎と開発プロジェクトの進め方
【内容】
Week1:人工知能(AI)とは
イントロダクション / 人工知能(AI)/ 機械学習
Week2:生成AIの応用事例とその仕組み
GANとは / GANの応用例 / GANの仕組み
Week3:AI開発プロジェクトの進め方
AI開発プロジェクトの流れ / 企画・要件定義フェーズ / データ準備フェーズ / PoC開発フェーズ
【学習期間】3週間
これまで、講座の動画制作は、撮影用のスタジオを用意し、あらかじめ準備した講義原稿を講師が解説する模様を撮影することが基本だったが、人物動画生成と音声合成の技術を活用することでスタジオに出向くことなく、かつ講師が資料説明する必要もなく、動画を制作することが可能となったという。今後、Withコロナ・Afterコロナの時代において、大学や研究機関、企業や団体が求める動画制作の効率化を目的として、AI技術を活用した動画制作のプロダクト化に向け開発を進めていくとのことだ。