Stable Diffusion(ステーブル・ディフュージョン)とは?利用方法や概要、画像生成AIについて簡単に解説
2024/3/8
Stable Diffusion(ステーブル・ディフュージョン)はイギリスのStability AIが開発した商用利用が可能なオープンソース画像生成AIです。Webブラウザで使うには、Stable Diffusionを利用した「mage.space」がおすすめです。早速、画像の作り方を確認してみましょう。
Contents
Stable Diffusionを利用できる5つのWebサービス
・mage.space
・Hugging Face
・Dream Studio
・Tensor.Art
・Stable Diffusion Online
編集部が試した結果、「maga.space」が一番簡単に画像を生成できたので、次に生成の方法を紹介します。
また、Stable DiffusionをローカルやGoogle Colaboratoryで実行したい方は、GitHubで公開されている対応コードをご参照ください。
mage.space
編集部が試した中では、一番簡単に画像を作ることができました。
早速、「mage.space」を利用して画像を生成してみましょう。
Step1: 指示文(プロンプト)を用意する
Step2: maga.spaceに指示文を入力する
Step3:画像が生成される
Hugging Face
2024年2月現在、516,520ものモデルが使えますが、サイトの作りが難しく、とっつきづらい印象です。
このプラットフォームの核心は、AI関連の知識や技術の共有を推進すること。利用者は自らのAIモデルやデータセットをアップロード・共有することが可能で、逆に他者の作成したものを簡単に探して利用することもできます。
さらに、「Hugging Face」は多様なAIツールを提供しています。その中で特に知名度が高いのが、自然言語処理向けの「Transformers」ライブラリ、画像や音声データに適した「Diffusers」ライブラリ、そしてデータセット操作を容易にする「Datasets」ライブラリなどです。これらのライブラリを基盤としたモデルやデータセットが「Hugging Face」上で共有されており、その結果としてAI界隈における信頼性と価値を確立しています。
Dream Studio
その使いやすいUI(ユーザーインターフェース)も特徴的で、高く評価されています。画面は英語ですが、Google翻訳を駆使すれば日本語ユーザーでもスムーズに利用できます。
実際使いやすいのですが、編集部が試してみた結果
「Something went wrong on our end, please try again later」というエラーが何度も出てしまい、画像の生成ができませんでした。キャッシュクリアや指示文の変更をしてもうまくいかなかったので、あまりおすすめはできません。
Tensor.Art
1クレジットを利用して画像を1枚生成することができ、1日99.6クレジット付与されます。
「リアルタイム」の左にあるブランクに指示文を入力し、画像を生成します。また、上部の「Search」から他の人が作った画像を見ることもできます。日本人のユーザーが多いようで、日本語で検索してもたくさんヒットするほど。使い勝手も良く、「mage.space」と同じようにおすすめです。
Stable Diffusion Online
しかし2024年2月現在、編集部が実際に試してみたところ画像が生成されず、画像生成のボタンを押してもトップに戻ってしまうだけでした。サイト内の他のページを見に行こうとしても広告が挟まり、そもそも利用ができません。
画像生成AIとは
Stable Diffusionとは
例えば、アマゾンの密林や夕暮れの海辺の風景など、様々なシーンを英語のキーワードで示すだけで、様々な画像を自動で生成することができます。
Stable Diffusionで生成される画像には、深層拡散モデルという先進的なアルゴリズムが搭載されています。このアルゴリズムの詳細を知らなくても、Google Colaboratoryなどの特別な環境でのコード記述を必要とせず、単純な文章入力だけで様々な画像を簡単に生み出すことができます。
Stable Diffusionの提供インターフェースは、非常に使いやすく設計されています。テキスト文章の入力が必要であり、その他のカスタマイズオプションも各インターフェースに備わっています。文章の質や内容によっては、さらに高度な画像を生成することも期待されます。
Stable Diffusionの使い方
Hugging FaceやDream Studioといったオンラインのアプリケーションを利用して生成する方法、もしくは、自らの設定した環境にStable Diffusionを導入し、プログラムを実行して生成する方法が考えられます。
Stable Diffusion web UIとは
Stable Diffusion web UIには、txt2img(テキストから画像を生成)とimg2img(ある画像から新たな画像を作成)の2つの機能が備わっています。特定の画像イメージを持っている方や、直接的に画像生成を試みたい方には、img2imgの方が向いています。また、サンプリングの頻度やCFGスケールなど、画像の質に関わる設定も日本語対応しているので、英語が得意でない方も手軽に好きなように調整できます。
まとめ
今後、AIの技術進歩に伴いAIを活用するのが当たり前の世の中になるときに備え、興味を持った方は実際に触ってみることをおすすめします。