再生数14万回超え。「AIひろゆき」仕掛け人の一人に聞く、開発の舞台裏とAIアバターの未来

AI

国内初、実在人物のAIアバターとして開発された「AIひろゆき」。音声・会話・動画のすべてをAIによってつくられたアバターで、人が関与することなく自動で質疑応答に応えることが可能です。過去2回行われたYouTube生配信はいずれも大盛況となり、ますますその未来に熱い視線が注がれています。AIひろゆきの仕掛け人の一人である株式会社デジタルレシピの代表取締役 伊藤 新之介氏に、AIを活用したコンテンツの現在と未来についてお話を伺いました。

飲み会での会話から生まれたAIひろゆき

――「AIひろゆき」が生まれた経緯を教えてください。

きっかけは飲みの席でのなにげない会話からです。ひろゆきさんのAI音声を開発したCoeFont社と「音声だけでなく、ひろゆきさんをAI化できたら面白そうですね」といった話で盛り上がって、CoeFont社の音声技術、AIdeaLabの画像生成技術、ChatGPTにも使用されている大規模言語モデルGPT-4を用いて開発がスタートしました。弊社は主にAIひろゆきの話すテキスト面の監修を行っています。

――その飲み会にひろゆきさんは同席されていたのでしょうか?

いえ、不在です。CoeFont社がひろゆきさんのAI音声を使って新しい試みをやってもOK、という許諾をご本人からいただいていたので、滞りなくプロジェクトは進みました。

――過去には「AI美空ひばり」など故人のAIアバターはありましたが、存命中の人物をAI化したことで見えてきた問題点や新しい知見があれば教えてください。

ひろゆきさんの魅力は外れ値に当たる発言だと思っているのですが、そういった発言の多くがGPT-4のフィルタリングに引っかかってしまい、我々が思うようなひろゆきさんの面白さを引き出せなかったという反省点はあります。

ひろゆきさんの過去動画のなかから150点ほどを抜粋してインプットしており、分かりやすい主義主張や口調が伝わるような動画を選んだのですが、フィルタリングが思ったより強かったため正しく反映できませんでした。今後はポリコレ(※)的な側面も考慮してアップデートしていきます。

得られた知見としては、AIで人格を再現するには舞台俳優の技能が役に立つということです。

※ポリコレ:ポリティカル・コレクトネス(政治的正しさ)のこと。人種、信条、性別、体型などの違いによる偏見や差別を含まない中立的な表現や用語を使用することを指す。

舞台俳優の力を借りて、ひろゆき氏のキャラを言語化

――舞台俳優はどのような点で役に立ったのでしょうか?

一言で説明するならひろゆきさんの性格、キャラクターを固める役割です。趣味や好物から、質問に対する返答の傾向や話し方の癖まで、あらゆる面から言語化をお願いしました。一人の人物でも人格は複数存在しますが、性格、口調、過去の発言などを組み合わせることで、皆が思うひろゆきさんっぽさを表現できるんです。

僕のような素人の観察力だと、ひろゆきさんの特徴を正確に言語化することは難しいです。「ひろゆきさんはこんな発言、絶対にしないだろう」と思っていても実はそれに近い発言をしていた、なんてことは往々にしてありますから。そこはやっぱりプロの出番ですね。

――AIの学習に舞台俳優のスキルが役立つことに気付いたのはいつですか?

演劇についてはまったく詳しくないのですが、以前、演劇と身体の関係について書かれた本を読んだことがあり、舞台俳優は人間の所作を言語化する能力が高いことを知ったんです。AIひろゆきの制作過程でもひろゆきさんの性格を言語化することが我々だけでは難しかったので、舞台俳優の方に協力を依頼しました。

彼らは人間の細かい動き、例えば不自然にならない視線の移動や靴下の履き方などについても言語化する訓練を受けており、そのとおりに動くとそれらしく見えるんです。普段から役づくりにおいては自分が演じるキャラクターの年表をつくり、ひたすら言語化のトレーニングを重ねているので、その言語化能力にかなり助けられました。

AIアバターに向いているのはポジティブなお笑い芸人?

――ちなみに、AIアバターで再現しやすい著名人はどんな人でしょうか?

松岡 修造さんのようなポジティブな発言をたくさんしてくれる人はAI化しやすいですね。もしくは、ライトな感じに毒舌を吐ける人。

――ポジティブな発言といいますと、お笑いのティモンディの高岸さんとか、ぺこぱさんとかはいかがですか?

両者ともに再現しやすいでしょうね。特にぺこぱさんのなんでも前向きに捉えるネタは相性がよいと思います。

――逆にマツコ・デラックスさんのような人は?

マツコさんの場合は口調が厳しいだけで発言内容は真っ当だと思います。ポリコレ的にも引っかかる点は少ないでしょうし、再現はできるはずです。

大事なのは、AI化されてキャラとしていろいろな発言をしても当人のイメージを毀損しないことです。海外ではAI彼女のようなサービスに性的な発言をさせようとするユーザーが多く発生して問題になっています。そうなると俳優などイメージを大切にする職業は難しくて、現状ではやはり芸人のほうがAI化には向いていますね。

――AIひろゆきのサイトにはユーザーから「今までひろゆきが言ったこと」と「ひろゆきが言いそうなこと」を募るフォームがありますが、送られた声はすでに4,000件を突破したそうですね。

ひろゆきさんの人格を再現させるには言語による情報が必要です。現状、GPT-4のような大規模言語モデルでは、自動的に大量の動画を読み込ませてひろゆきさんの性格を再現させることができません。かならず言語的なデータをインプットする必要があるんです。

――フォームから送られてくる情報の精度はどのくらいなのでしょうか。すべての情報が採用されるわけではないですよね?

そうですね、こちらでチェックして極端に外れた内容のものは省くときもあります。

――例えば、芸人がモノマネをして、その人らしい発言をするネタをがありますが、AI化にはそういった芸人のスキルも役立ちそうだと感じました。

たしかに芸人のそういった視点は役立ちそうですね。ひろゆきさんに対して世間一般の人が感じる特徴のようなものをしっかり言語化できれば、AIひろゆきの精度も上がるはずです。

すでにAIは発言から人間の心理状態を読める域に

――AIひろゆきは国内初となる実在人物のAIアバターとのことですが、リリース時に批判などはありましたか?

それがぜんぜんありませんでした。やっぱりそこは、ひろゆきさんのキャラでしょうね。多くの人が「やりそうだな」というイメージだったのでしょう。ただ、YouTuberもVTuberも消えそうだという危機感を抱いた人からは、ディストピアだという指摘を受けました。

――AIの進化に伴い、AI脅威論も叫ばれるようになりました。伊藤さんのスタンスを教えてください。

部分的には楽観的で、部分的には悲観的です。エンタメ領域においてAIの進化は大歓迎ですが、アメリカではAIを用いた犯罪数が急増しているというデータもあります。詐欺のような犯罪はもちろん、見た目だけでは判別できないフェイクニュースも生まれやすくなるでしょうね。すでにChatGPTの登場により、Amazonレビューのサクラのクオリティも急激に向上しています。

――自然な文章がAIで書けるようになると、いずれは人同士のチャットでのやり取りの際もAIに助言を求めるようになったりするのでしょうか?

いずれはそうなるでしょう。発言内容から当人がどんなことを考えているのかを当てるテストをAIにやらせたところ、正答率が6割を超えたそうです。AIは人間の心理状態を読める領域にまで進化してきているので、ベストな返答方法を教えてくれるサービスもそう遠くない未来に出てくると考えます。

数ヵ月後〜数年後には、AIひろゆきと本人の見分けがつかなくなる!?

――AIひろゆきに続くAIアバターの展開は考えていますか?

いろいろと考えています。本田圭佑さんや作家で経営コンサルタントの神田昌典さん、ブロガーのちきりんさん、それ以外に歴史上の偉人も30人ほど準備を進めています。僕はAIアバターの技術を活かして、あらゆるものを擬人化できたら面白いなと考えているんですよ。

――あらゆるものを擬人化とは?

漫画の『ONE PIECE』には地面や植物が言葉を話すトットランドという島が出てきますが、このセンスは極めて日本らしいと思うんです。例えば現状、会議をするときは議事録を取っていますが、会議を擬人化すれば質問することで内容を教えてくれるようになります。同じように書籍の擬人化も考えています。歴史に名を残す多くの偉人が書籍を残していますが、これからの時代は当人の人格を後世に残せるようになります。

――ひろゆきさん本人もAIひろゆきに対して「本人と見分けがつくのはあと数年の間かな」と発言していますが、どのくらいでAIは人間と遜色ないレベルに達するでしょうか?

何年後ではなく何ヵ月後かもしれません。ChatGPTもそうですけれど、新しいテクノロジーは人間の予測をはるかに超えて実現されていきますから。ChatGPTが出てくる以前は、あのレベルのAIが登場するまでは数年先と予測されていたと思います。

――デジタルレシピとしての今後の展望を教えてください。

我々は「-Everything Job Assistant-」、すべての人にジョブアシスタントを届けることを目指しています。AIで人格を再現することもそこにつながるわけですが、長期的な展望としてはジョブアシスタントを開発し続けていきます。特にやりたいのが、企業のコールセンターなどに導入するようなAI電話です。現時点では一方的に話すタイプのAI電話なら可能ですが、我々が目指すのは双方向のコミュニケーションです。

目下の課題は音声クオリティと方言への対応です。先日、鹿児島弁に対応した「Jaddo(じゃっど)GPT」というサービスをリリースしたところ、Web上でバズって複数のメディアから取材いただきました。これは開発してから分かったことですが、方言のデータは災害時に役立つのです。方言のある地方で災害が発生したときにレスキュー隊や救急医が地元の人の言葉を正確に理解できないケースが多々あるようで、そういった緊急時に役立つ可能性があります。GPT-4は翻訳も優れているので、災害時の外国人救助にも役立つ。そういった視点で、世の中の役に立つジョブアシスタントをこれからも提供していきます。

伊藤 新之介

株式会社デジタルレシピ 代表取締役

同志社大学生命医科学部医情報学科中退。同大学在学中に学習塾の立ち上げなどを行い、2013年株式会社ラフテックを創業。同社を株式会社ベクトルに売却後、2018年に株式会社デジタルレシピのCEOに就任。
AIライティングアシスタントサービス Catchy(キャッチー)をリリース。GPT-3を活用したマーケティングの効率化を研究中。

Article Tags

Special Features

連載特集
See More