AIの思考を人間が助ける。AI領域で人気の職種「プロンプトエンジニア」とは何か

AI

プロンプトエンジニアという言葉をご存知でしょうか。英語圏では2021年頃から盛り上がりを見せている職種の一つで、中国でも2022年の夏頃からプロンプトエンジニアの講座が人気を呼んでいます。今回は、プロンプトエンジニアとは何か、どうトレーニングすればよいのかについて、日本国内でプロンプトエンジニアの採用と教育を実施している株式会社デジタルレシピ 代表取締役の伊藤 新之介氏に解説していただきました。

AIの進化とともに需要が高まる「プロンプトエンジニア」とは

プロンプトエンジニアとは、近年世界的に話題を呼んでいる画像生成AIや文章生成AIといったGenerative AI(コンテンツ生成AI)に命令する役割で、実際にコンテンツを生成したり、生成の質を改善したりするための職種です。文章生成AIのGPT-3、画像生成AIのStable DiffusionなどのGenerative AIには共通点があり、コンテンツを生成するためには、プロンプトと呼ばれる指示文をインプットさせる必要があります。特に日本では、プロンプトのことを「呪文」と呼ぶ場合もあり、まさにプロンプトエンジニアは、目当てのコンテンツをAIに生成させるための「呪文」を作成するお仕事といえます。

英語圏では、すでにGPT-3などの文章生成AIが多くの産業に組み込まれており、メールや記事、広告など文章生成に関わるさまざまな用途でプロンプトエンジニアが活躍しています。LinkedInの創業者リード・ホフマン氏がインタビューで語ったように、今後、Generative AIは史上類を見ないイノベーションをもたらし、5年以内にさまざまな産業で中心的な役割を担うことになると予測されています。そのとき、人間がGenerative AIを操作する要になるのがプロンプトエンジニアリングであり、この職種の需要はGenerative AIの進化と比例していくものと考えられます。

日本国内では、私が経営するデジタルレシピが、GPT-3を使ったビジネス向けの文章生成サービス「Catchy」を2022年7月に日本で初めて公開しました。Catchyでは5名のプロンプトエンジニアチームが、日々プロンプトの改善を行っており、多くの知見を蓄積しています。ここからは、GPT-3を例にしながら、プロンプトエンジニアリングの基礎を解説していきます。

プロンプトエンジニアリング入門

プロンプトエンジニアリングは、大きく分けて三つのステップで行うことができます。プロンプトエンジニアという職種を目指すつもりがない方にも、AIによる文章生成の実態をご理解いただきやすいように、サンプルテキストを用いた生成結果をお見せしながら解説したいと思います。

STEP1 GPT-3に登録する

まずは「OpenAI API」のWebサイトにアクセスし、右上の「SIGN UP」からGPT-3の会員登録を行います。
利用料金は従量課金制で、会員登録してから3ヵ月間は18ドル分(1ドル140円換算で2,520円相当)を無料で使うことができます。GPT-3では、性能別に四つのモデルが用意されており、最も高性能で単価の高いDavinciモデルだと1,000トークンあたり0.02ドル(1ドル140円換算で2.8円相当)です。日本語でプロンプトエンジニアリングを行う場合、1,000トークンあたり約600〜700文字程度にあたります。つまり、2,520円分で54万~63万文字程度まで利用することが可能なので、無料の範囲内で十分にトレーニングを行うことができます。

STEP2 プロンプトエンジニアリング開始

会員登録が完了したら、実際にプロンプト作成のトレーニングができる「Playground」に移動しましょう。
Playgroundに移動すると、下記のような画面が表示されます。右にあるパラメータは安定したアウトプットになるようにデフォルトで設定されているため、最初のうちは調整をする必要がありません。
出典元:「OpenAI API(https://beta.openai.com/overview)」のPlayground画面
では早速、下記のテキストをコピーして、Playgroundの入力画面にペーストしてみましょう。あまり難しいことは考えず、まずはどういったアウトプットが出てくるのか実感してみることが大切です。

サンプルテキスト
=========================
サトシとハナコがAIの将来について、日本語で会話しています:
サトシ: AIの進化は、私たちが思っているより早いと最近よく実感します。
ハナコ: 確かにそうですね。AIは様々なビジネスに広く適応されはじめています。
サトシ: 今後5年で、AIはどんな進化をすると思いますか?
ハナコ:
=========================

コピー&ペーストができたら、Submitボタンを押してみましょう。
出典元:「OpenAI API(https://beta.openai.com/overview)」のPlayground画面
すると、緑でマーカーされたテキストが生成されると思います。このテキストが、プロンプトを入れたことによってAIが生成したコンテンツです。
出典元:「OpenAI API(https://beta.openai.com/overview)」のPlayground画面
実際にPlaygroundからプロンプトを入れた方は分かると思いますが、ご自身の画面上で出てきた緑マーカーのアウトプットと、上記画像のアウトプットのテキストが異なっているかと思います。画像生成AIもそうですが、プロンプトを用いる多くのGenerative AIは、一つのプロンプトに対して一意的な答えを持っているわけではなく、ランダム性を持ってコンテンツを生成します。そのため、パラメータを調整したり、束縛条件の高いプロンプトを入れたりしない限り、毎回生成されるコンテンツが異なります。

STEP3 いろいろなプロンプトのパターンを試す

STEP2の例に出したプロンプトは、連想ゲームのような形式でAIに予測させる文章になっています。さらに噛み砕いた表現に直し、

サトシはハナコに、「〇〇」と話し、ハナコは「□□」と返答しました。 その返答に対して、サトシは「△△」とハナコに質問をしました。 さて、ハナコはサトシの質問にどう返したでしょうか。

とGPT-3に対してクイズを投げかけてみることも同義です。こうした連想形式のプロンプトは、GPT-3のプロンプトパターンのなかでも代表的な型で、この連想形式プロンプトをベースにして、話者を3名に増やしたり、各人のキャラクター性を定義したりするなどして、さまざまなアウトプットをつくることが可能になります。

連想形式プロンプト以外にも、命令形式プロンプトというシンプルな型も代表的です。例えば、下記のプロンプトをPlaygroundに入れてみましょう。

=================
以下の文章を日本語で簡潔に要約しろ:
文章: プロンプトエンジニアとは、近年世界的に話題を呼んでいる画像生成AIや文章生成AIといったGenerative AI (コンテンツ生成AI)に命令して、実際にコンテンツを生成したり、生成の質を改善するための職業です。 英語圏では、既にGPT-3などの文章生成AIが多くの産業に組み込まれており、メール生成、記事生成、広告生成など文章生成に関わる様々な用途でプロンプトエンジニアが活躍しています。
=================
出典元:「OpenAI API(https://beta.openai.com/overview)」のPlayground画面
すると、下記のような結果が返ってきます。
出典元:「OpenAI API(https://beta.openai.com/overview)」のPlayground画面
このように、シンプルな命令文の形式でもアウトプットを生成することが可能です。ただし、GPT-3の公式ガイドラインには、「質の高いプロンプトをつくるためには、命令文に対して、できるだけ豊富な例文を渡すことが重要」と書かれています。プロンプトエンジニアとして、質の高いプロンプトをつくりたい場合、シンプルな命令形式のプロンプトだけでは足りないことがほとんどで、的確で分かりやすい命令文と、豊富で質の高い例文をどれだけ用意できるかが、アウトプットの質を決める大きな要因となっています。プロンプトエンジニアとして技術を高めていくにあたり、最初は連想形式と命令形式の両方でいろいろな生成を試してみて、思い通りのアウトプットを生成できるか実験してみることをおすすめします。

プロンプトエンジニアリングにおいて、こうした属人的な試行錯誤が求められる理由は、GPT-3を開発しているOpenAIを含めて、本当に質の高いプロンプトパターンが何なのかを誰も分かっていないためです。AIの領域では、モデルの性能が上がれば上がるほど、その生成プロセスがブラックボックス化してしまう「解釈可能性(Interpretability)」という問題が発生します。近年では、こうした解釈可能性を導き出すXAI(説明可能AI)という分野が立ち上がるほど、高性能なAIのブラックボックス化が進んでいます。

GPT-3も例外ではなく高性能であるがゆえに、期待するアウトプットを生成するための最適解のプロンプトも、そのための内部プロセスもブラックボックスです。今後、XAIがブラックボックス問題を解決する日が訪れるかもしれませんが、それ以上に現在はGenerative AIの性能の進化がすさまじく、GPT-3がリリースされて1年半が経った今でも解決できていない状況です。プロンプトエンジニアの価値は、こうしたブラックボックスなGenerative AIの構造をいち早くハックし、自由自在に操れることにあると私たちは考えています。

結局、現在プロンプトエンジニアに求められるのは国語力

AIのブラックボックス問題の影響もあり、最先端AIを使いこなす鍵を握っているのは、面白いことに人間の感性であり、その職種がプロンプトエンジニアです。現在、プロンプトエンジニアリングで期待されていることは、生成したいアウトプットに最適なプロンプトをつくり上げることです。そのためには、生成されるアウトプットの評価も、プロンプトの実験も、その人の言語能力にかなり依存するわけです。

特にGPT-3のような文章生成AIでは、マーケティングや小説などのエンタメ領域に寄れば寄るほど、生成された文章の良し悪しの定量判断が難しくなり、その人の業界的な知見や国語能力に委ねられます。また、プロンプトにおける適切な命令文は冗長的な文章よりも、適切な形容詞や汎用性の高い簡潔な表現のほうが好ましいことも、さまざまな研究で分かっており、例文についても同様のことがいえます。そのため、言語的な表現の豊かさによってプロンプトの大きな改善を見込むことができることから、プロンプトエンジニアリングは、文系人材に適したエンジニア職と呼ばれることもあります。

もちろん、Generative AIの進化はすさまじく、プロンプトの形式自体が大きく変わる可能性もあります。しかし、AIとの対話が、プログラミング言語のような人工言語から、日本語や英語のような自然言語にシフトしていく流れが今後も加速することは間違いありません。AIと対話するためのスキルを磨くことが、今後も重宝される可能性は高いのではないでしょうか。

伊藤 新之介

株式会社デジタルレシピ 代表取締役

同志社大学生命医科学部医情報学科中退。同大学在学中に学習塾の立ち上げなどを行い、2013年株式会社ラフテックを創業。同社を株式会社ベクトルに売却後、2018年に株式会社デジタルレシピのCEOに就任。
AIライティングアシスタントサービス Catchy(キャッチー)をリリース。GPT-3を活用したマーケティングの効率化を研究中。

Article Tags

Special Features

連載特集
See More