Stable Diffusion（ステーブル・ディフュージョン）とは？利用方法や概要、画像生成AIについて簡単に解説

Stable Diffusionを利用できる5つのWebサービス

Stable Diffusionを手軽に試したい場合、以下の5つのWebが利用できます。

・mage.space
・Hugging Face
・Dream Studio
・Tensor.Art
・Stable Diffusion Online

編集部が試した結果、「maga.space」が一番簡単に画像を生成できたので、次に生成の方法を紹介します。
また、Stable DiffusionをローカルやGoogle Colaboratoryで実行したい方は、GitHubで公開されている対応コードをご参照ください。

mage.space

「mage.space」は、アメリカのOllano社が提供する画像生成のプラットフォームで、Stable Diffusionを活用したWebサービスとして広く受け入れられています。基本的な利用は無料で可能ですが、有料プランを選ぶことで多彩な学習済みモデルにアクセスできるのが魅力。これにより、画像生成の初心者でも、意図した画像を容易に生成できます。

編集部が試した中では、一番簡単に画像を作ることができました。

早速、「mage.space」を利用して画像を生成してみましょう。

Step1：指示文(プロンプト)を用意する

画像生成方法①

2024年2月現在、多くのAI関連サービスは英語を共通言語として成り立っています。作りたい画像の指示文を、なるべく適切に伝えられるようにDeepLで作りましょう。

Step2： maga.spaceに指示文を入力する

画像生成方法②

「mage.space」にアクセスし、Select Modelsで「Stable Diffusion v1.5(旧型)」か「Stable Diffusion v2.1(新型)」を選んだのち、Step.1で作った指示文を、の入力窓に打ち込み、画像を生成してください。

Step3：画像が生成される

画像生成方法③

画像の完成です。イメージに合わない場合は、指示文やsettings、学習済みの有料modelsを変更してみましょう。

Hugging Face

アメリカ発の「Hugging Face」は、AI関連のモデルやデータの共有・活用を目的としたオープンソースのプラットフォームとして知られています。特に自然言語処理領域において注目され、多くのAI開発者や研究者たちが集まる中心的なサイトです。

2024年2月現在、516,520ものモデルが使えますが、サイトの作りが難しく、とっつきづらい印象です。

このプラットフォームの核心は、AI関連の知識や技術の共有を推進すること。利用者は自らのAIモデルやデータセットをアップロード・共有することが可能で、逆に他者の作成したものを簡単に探して利用することもできます。

さらに、「Hugging Face」は多様なAIツールを提供しています。その中で特に知名度が高いのが、自然言語処理向けの「Transformers」ライブラリ、画像や音声データに適した「Diffusers」ライブラリ、そしてデータセット操作を容易にする「Datasets」ライブラリなどです。これらのライブラリを基盤としたモデルやデータセットが「Hugging Face」上で共有されており、その結果としてAI界隈における信頼性と価値を確立しています。

Dream Studio

「DreamStudio」はイギリスのStability AI社が提供する「Stable Diffusion」のオープンβテスト版としてリリースされている画像生成ツールです。他のプラットフォームと同じく、テキスト（プロンプト）を打ち込むだけで、手軽に画像を生成することができます。

その使いやすいUI（ユーザーインターフェース）も特徴的で、高く評価されています。画面は英語ですが、Google翻訳を駆使すれば日本語ユーザーでもスムーズに利用できます。

実際使いやすいのですが、編集部が試してみた結果
「Something went wrong on our end, please try again later」というエラーが何度も出てしまい、画像の生成ができませんでした。キャッシュクリアや指示文の変更をしてもうまくいかなかったので、あまりおすすめはできません。

Tensor.Art

「Tensor.Art」は美少女系の画像生成が得意な画像生成サイトです。
1クレジットを利用して画像を1枚生成することができ、1日99.6クレジット付与されます。

「リアルタイム」の左にあるブランクに指示文を入力し、画像を生成します。また、上部の「Search」から他の人が作った画像を見ることもできます。日本人のユーザーが多いようで、日本語で検索してもたくさんヒットするほど。使い勝手も良く、「mage.space」と同じようにおすすめです。

Stable Diffusion Online

「Stable Diffusion Online」はBlack Technology LTDが提供するWebサイトで、他のサイトと同じくStable Diffusionのモデルで画像生成できるようです。

しかし2024年2月現在、編集部が実際に試してみたところ画像が生成されず、画像生成のボタンを押してもトップに戻ってしまうだけでした。サイト内の他のページを見に行こうとしても広告が挟まり、そもそも利用ができません。

画像生成AIとは

画像生成AIとは、ChatGPTなどの文章生成AIと同様にテキスト入力した内容をAIが自動でオリジナル画像を作り出す技術のことを指します。例えば、AIに「夕暮れの海辺の風景」などと指示すると、それに合った画像をAIが自動で作ってくれるというものです。驚くような技術進歩のおかげで、このAIが作る画像は、まるで本物の写真のようにリアルなものが多くなっています。代表的な画像生成AIには、「Stable Diffusion（ステーブルディフュージョン）」や「Midjourney（ミッドジャーニー）」があります。

Stable Diffusionとは

Stable Diffusionは、ユーザーが入力した文章に基づき、質の高い画像を生成するAI技術です。
例えば、アマゾンの密林や夕暮れの海辺の風景など、様々なシーンを英語のキーワードで示すだけで、様々な画像を自動で生成することができます。

Stable Diffusionで生成される画像には、深層拡散モデルという先進的なアルゴリズムが搭載されています。このアルゴリズムの詳細を知らなくても、Google Colaboratoryなどの特別な環境でのコード記述を必要とせず、単純な文章入力だけで様々な画像を簡単に生み出すことができます。

Stable Diffusionの提供インターフェースは、非常に使いやすく設計されています。テキスト文章の入力が必要であり、その他のカスタマイズオプションも各インターフェースに備わっています。文章の質や内容によっては、さらに高度な画像を生成することも期待されます。

Stable Diffusionの使い方

先述の通り、Stable Diffusionは深層拡散モデルを備えたオープンソースのAI技術です。このため、インターネット上のプラットフォームで動かすことも、自分のPC上で独立して実行することもできます。

Hugging FaceやDream Studioといったオンラインのアプリケーションを利用して生成する方法、もしくは、自らの設定した環境にStable Diffusionを導入し、プログラムを実行して生成する方法が考えられます。

Stable Diffusion web UIとは

「Stable Diffusion web UI」とは、AUTOMATIC1111氏が開発したユーザーフレンドリーなツールです。このツールを使用すると、Stable Diffusionを簡単かつ直接的に活用できます。もちろん、ローカルのPC上でも動作させることができますが、高いPCスペックが必要なため、初めての方はクラウド上での利用を推奨します。どちらの方法でも、実行にはGitHubで公開されているコードの導入が必須です。

Stable Diffusion web UIには、txt2img（テキストから画像を生成）とimg2img（ある画像から新たな画像を作成）の2つの機能が備わっています。特定の画像イメージを持っている方や、直接的に画像生成を試みたい方には、img2imgの方が向いています。また、サンプリングの頻度やCFGスケールなど、画像の質に関わる設定も日本語対応しているので、英語が得意でない方も手軽に好きなように調整できます。

まとめ

ここまでStable Diffusionについて使用方法や概要について解説してきました。ChatGPTを始めとした生成AIは頭で理解するより実際に触って体験することが習得の近道です。
今後、AIの技術進歩に伴いAIを活用するのが当たり前の世の中になるときに備え、興味を持った方は実際に触ってみることをおすすめします。