2023年9月21日にDALL·E 3が公開されましたね。
ずっと触れていなかったので、触っていきたいと思います。
ChatGPT4による解説
DALL·E 3自体に解説してもらいました。
DALL·E 3は、OpenAIが開発したニューラルネットワークモデルの一部です。DALL·Eシリーズは、テキストの記述から画像を生成することができるモデルで、特にビジュアルなコンテンツの生成に強い点が特徴です。以下、DALL·E 3の主な特徴をいくつか挙げてみましょう。
- 高度な画像生成: DALL·E 3は、テキストのプロンプトから高解像度の画像を生成する能力があります。ユーザーが提供するテキストの指示に基づいて、具体的なビジュアルコンテンツを生成することができます。
- 柔軟性: DALL·E 3は、さまざまなスタイルやテーマの画像を生成することができます。例えば、歴史的な絵画のスタイルやファンタジーの世界観など、多岐にわたるテーマでの画像生成が可能です。
- ポリシーの適用: DALL·E 3の使用には、特定のポリシーやガイドラインが適用されます。これにより、不適切なコンテンツの生成を防ぐための対策が取られています。
- 改良されたインターフェース: DALL·E 3は、前のバージョンに比べてユーザーインターフェースが改良されており、より直感的に操作することができます。
DALL·E 3は、クリエイティブな分野での応用が期待されるツールの一つとして、多くの注目を浴びています。特にデザインやアート、広告などの分野での利用が考えられています。
Q:以前のバージョンより良くなった部分はなんですか?
DALL·E 3の以前のバージョンと比べての主な改善点や進化した部分を以下に挙げます。
- 解像度の向上: DALL·E 3は、より高解像度の画像を生成することができるようになりました。これにより、細部まで詳細な画像が生成可能となり、クオリティの高いビジュアルコンテンツを作成することができます。
- 生成精度の向上: DALL·E 3は、テキストのプロンプトに対する忠実度が向上しています。つまり、ユーザーが指定した内容により近い画像を生成することができるようになっています。
- 多様性の強化: 一つのプロンプトから、さまざまなスタイルや視点での画像を生成することが可能となりました。これにより、ユーザーの要望に合わせた多岐にわたる画像生成が実現しています。
- ユーザーインターフェースの改善: DALL·E 3のインターフェースは、より直感的で使いやすくなっています。これにより、ユーザーが求める画像をより簡単に生成することができるようになりました。
- ポリシーの強化: DALL·E 3では、不適切な画像の生成を防ぐためのポリシーやガイドラインが強化されています。これにより、安全で信頼性の高い画像生成が可能となっています。
これらの進化や改善により、DALL·E 3は前のバージョンと比べて、より高度で多様なビジュアルコンテンツの生成が可能となっています。
デフォルトモデルだと、学習データが2022年までなので回答が生成されませんでした。
設定できるパラメーターについて
Q:あなたに画像生成を依頼する際に指定できるパラメーターを教えてください。
画像生成を依頼する際に指定できるパラメーターは以下の通りです:
- size: 生成する画像の解像度を指定します。以下の3つのオプションから選べます。
- "1792x1024" (wide): 横長の画像
- "1024x1024" (square): 正方形の画像(デフォルト)
- "1024x1792" (tall): 縦長の画像。全身のポートレートなどに適しています。
- prompts: 画像の内容を記述するテキスト。ユーザーが特定の枚数を指定しない限り、2つのキャプションを作成します。複数のキャプションを作成する場合、それらはできるだけ多様性を持たせるようにします。
- seeds: 各プロンプトに使用するシードのリスト。ユーザーが以前の画像を修正するように求めた場合、その画像を生成するために使用されたシードからこのフィールドを埋めます。
これらのパラメーターを使用して、希望する画像の内容やスタイルを具体的に指定することができます。
Q:ネガティヴプロンプトを指定することはできますか?
申し訳ございませんが、現在のDALL-Eの実装ではネガティヴプロンプト(画像に含めたくない要素を指定するプロンプト)を直接サポートしていません。しかし、希望する画像の内容を具体的に記述することで、不要な要素を排除することは可能です。
例えば、ある特定の要素を含めたくない場合、それを明確に指定するのではなく、希望する他の要素を具体的に記述することで、不要な要素を避けることができます。
もしご希望の画像に特定の要素を含めたくない場合は、その旨を具体的にお伝えいただければと思います。
ネガティブプロンプトが利用できないのは中々に痛いですね。
プロンプト
利用するプロンプトは、以下で利用したものを流用します。
出力物
- 指定サイズ:1024x1024
- 出力物
雰囲気は捉えていますが、だいぶあざとく仕上げてきましたね。
説明にはないサイズを指定して生成されるか実験してみましたが、問題なく生成されました。
- 指定サイズ:768x768
- 生成物
メスガキっぽくはないですが、ちゃんと女の子が出力されていますね!なぜかモンハン持ちしていますが。。。
最後に
設定できるパラメーターがあまり多くないので、クオリティには期待していませんでしたが、普通にクオリティー高いですね!
また生成した後にどういう風にして欲しいか聞いてくれるので、リテイクのしやすさもGood!ですね!
ちなみに生成された画像の拡張子は、WebP(ウェッピー)でした。
また提示されたパラメーター以外の画像サイズを指定することができたので、実はたくさんのパラメーターを理解できるかもしれませんね。
AIの進化のスピードは凄まじいですね。
これからもできる限りウォッチしていきたいと思います。
以上、どなたかのお役に立てれば幸いです。