AIで画像生成してみたい!と思って、Stable Diffusionを試そうとしたんですが、
NVIDIA製のグラボじゃないとダメでした。。。
CUDAを利用する様で、Radeon端末にインストールすると、エラーになってしまいました。
その為、M2MBAで利用可能なDiffusion Beeを試してみました。
MBA自体のスペックは以下記事にあります。
インストールについて
公式サイトからダウンロードしてインストールすればOKです。
今回は綺麗なイラストが欲しいので、MacOS -Apple Silicon - HQ Version を利用します。
インストールや説明に関しては、GitHubの方が詳しく書かれています。
Macなのでダウンロードした後に、アプリケーションフォルダに移動するだけですが。
利用するカスタムモデルについて
Githubのドキュメントに記載があるHugging Faceからモデルをダウンロードしました。
取り敢えずMost Likesでソートをかけて、
上から二次元美少女イラストに特化したものを3点ほど選びました。
- hakurei
waifu-diffusion
利用ファイル:model-epoch09-float16.ckpt
Like数:1611
- andite
anything-v4.0
利用ファイル:anything-v4.5-pruned-fp16.ckpt
Like数:940
⭐️2023/07/27追記:該当ページは削除されたようです。
- eimiss
EimisAnimeDiffusion_1.0v
利用ファイル:EimisAnimeDiffusion_1-0v.ckpt
Like数:293
利用する設定について
利用するM2MBAはスペック高いので、設定値高めで回していきます。
また、今回はテキストによる生成を前提にします。
Text to Image > Optionsから設定します。
項目 | 値 |
---|---|
Number of Images | 1 |
Batch size | 1 |
Resolution(wide) | 768 |
Resolution(high) | 768 |
Steps | 50 |
Guidance scale | 20 |
Seed | -1 |
Custom Model | 任意 |
Nagative Prompt | Disable |
Nagative Promptについて
DiffusionBeeでも、ネガティブプロンプトの利用は可能ですが、
初期だとOFF(Enable表示)になっていますので、ON(Disable表示)にします。
この設定であれば、5分程度で出力されます。
- 動作時のリソース使用量について
GPUとメモリをギチギチに持っていきますねぇ
メモリが16/24GB利用されていますが、コーディングやネットサーフィンぐらいは余裕でできます。
利用プロンプトと成果 ChatGPT版
- ChatGPTに聞いてみた
Cute anime girl,Kawaii girl illustration,Adorable female character drawing,Pretty girl cartoon art,Sweet and charming girl portrait
ツンデレアドバイスを元に作成したのはこちら。
- Default
- waifu-diffusion
- anything-v4.0
- EimisAnimeDiffusion_1.0v
waifu-diffusionは完全に人外娘になっていますが、他は指の数や関節がおかしいですが、結構いけますね。
ネガティブプロンプトの大切さがよくわかりわかりますね。。。
利用プロンプトと成果 先駆者参考版
- 先駆者様の情報を参考にした
以下、参考サイト様の「クリスタルのお姫様」のものをお借りしました。
Stable Diffusionの呪文のコツ総まとめ!神絵師のような美麗イラストを生成しよう
- Default
- waifu-diffusion
- anything-v4.0
- EimisAnimeDiffusion_1.0v
クオリティの上がり方がえげつないですね!
Defaultがカウボーイハットを被っているのは、
プロンプト内の「cowboy shot」という文字列をカメラ用語ではなく、
カウボーイ要素として判定しているようです。
その為、生成した画像に馬が入っているケースもありました。
まとめ
いやー、AIの進歩ってすごいですね。
うまく活用すれば、個人的に作成/開発しているコンテンツで、
絵師の方に発注しないでも、ある程度のクオリティは維持できそうですね。
以上、どなたかのお役に立てれば幸いです。