こんにちは! AI を実行する これです。
前回の投稿を通じて AI の実行時 安定拡散による AI 画像を 10 分で作成その方法をお見せしました。次は、安定拡散のモデルとパラメーターを調整して、目的の画像を作成する方法を紹介します。🤗
それでは始めましょう!
上の画像のようにStable Diffusion Web UIに接続すると、画像を生成するためのさまざまな設定があることがわかります。これらはどういう意味ですか? また、希望に近いイメージを作成する方法を教えてください。🤔
それでは、主な設定を1つずつ見ていきましょう。
プロンプト
作成する画像のテキストを入力する場所です。ネガティブプロンプト
生成された画像から除外する部分を入力して設定できます。サンプリング方法
と サンプリングステップ
存在します。 サンプリング方法
生成する画像からノイズを除去するためのモデルを設定する部分です。サンプリングステップ
ノイズ除去回数は以下で設定できます採用。修正
選択肢があります。このオプションは、作成後に画像の解像度を調整 (アップスケール) するオプションです。簡単に言うと、低画質の画像を指定の画質に設定した画像に合わせるオプションです。リファイナー
画像を作成した後に別の画像学習モデルを適用して細部を改善する部分です(同時に2つの異なるモデルを使用できるという利点があります!)で切り替え
リファイナーモデルをいつ交換するかは、設定で設定できます。0 に近いほど、リファイナーモデルの使用量が多くなります。バッチカウント
調整することで作成できます。 バッチカウント
2 に設定すると、1 番目のイメージが作成された後に 2 番目のイメージが生成されます。バッチサイズ
設定できます。 バッチサイズ
2 に設定すると、2 つのイメージが同時に生成されます。CFG スケール
画像作成時に入力されます プロンプト
この設定は、イメージ結果にどの程度影響するかを制御します。値が大きいほど、 プロンプト
忠実な画像を作成しようとしていますが、画像は歪みやすくなります。逆に、値が小さいほど、生成しようとした画像から離れますが、画質は向上します。シード
画像は経由で修正できます。同じ シード
と同じ プロンプト
ラーメンに似たイメージが作成され、オプションが変更されても、既存のイメージから大きく逸脱しないイメージとして作成されます。
私が望む完璧な画像を作成するには プロンプト
最も重要なことは上手に書くことです。どんなにセッティングが良くても プロンプト
めちゃくちゃになっていると、思い通りの画像が作れなくなります。
だから、 プロンプト
書き方のヒントをいくつかご紹介します
プライマー プロンプト
書くときには、以下のルールがあります。
ルールを理解し、作成する画像の特徴的なフレーズをリストアップしてください。 ネガティブプロンプト
同様に、画像から除外したい部分を指定します。
上記のようにプロンプトを入力すると、次の画像が生成されます。
他の人が作った画像を見ると、とてもカラフルで高品質な画像がたくさんあるのに、なぜ私が作った画像はその品質から出てこないのでしょうか?🥺 それをする人のために用意しました。
コミュニティを利用して、アニメキャラクター、実写キャラクター、モンスターなどの高品質な画像を作成する方法!
まず、Stable Diffusionユーザーが使用する代表的なコミュニティは何ですか? ハグフェイスと 市民私はそれを持っている。
ハグフェイスは、トランスフォーマーやデータセットなどの人工知能プラットフォームを提供するサービスで、Dual Stable Diffusionのユーザーは主にハブ機能を使用します。これは、実写キャラクターやアニメキャラクターなどを制作するためのモデルを共有しているからです。
市民は、主にStable Diffusionを対象として学習モデルを共有しているオープンソースのWebサイトで、生成されたさまざまな画像を確認できます。
プライマー 市民 色んなユーザーが作成した画像の中から好きな画像を選んで、同じ画像を作成してみます。
私たちは実写の画像を選びました。右側には、使用したモデルと画像の生成に使用されたパラメーターが表示されます。
「使用リソース」タブを見ると、「使用済み」を参照してください チェックポイント
、 ロラ
モデルを表示できます。
3 つのモデルをダウンロードして、次の場所に保存します。
画像の作成時に使用されるパラメーターは、WEB UI に直接コピーされます。
パーツを見ると
パラメーターをそのままコピーして画像を作成するときに、目的の画像の形状が生成されないことがある場合は、最初に [プロンプト] と [ネガティブプロンプト] を確認してください。
プロンプトローラ
モデルの場合 <lora:Trigger Words>
歯のように塗っているのがわかります トリガーワード
更新すると変わる可能性があるので、そのモデルに移動 トリガーワード
検索。
<lora:chilloutmixss_xss10:0.8>
トリガーワードがうまく機能しない場合は、上記のトリガーワードに変更して適用する必要があります。 <lora:photorealistic>
以下の変更が必要です。
それから ネガティブプロンプト
パーツを見ると イージーネガティブ
使われているのが分かります。
イージーネガティブ
の場合、現在はキャラクター画像を作成する時に多く使われています 反転
これです。いろいろ学んだ プロンプト
一言で省略して応用できるモデルです。
市民Easy Negativeもダウンロードするには、次のパスを検索するか、アクセスしてください。
上記と同様 トリガーワード
コピーして ネガティブプロンプト
列に入力してください。次のように プロンプト
で指定した特性をそのまま適用した画像が作成されていることがわかります。
Stable Diffusion で画像を作成すると、作成時に画像に適用されたパラメーター情報がメタデータとして保存されます。owing ウェブイ
に PNG 情報
適用されたパラメータを表示するには、タブに移動して対応する画像をアップロードします。
ただし、Stable Diffusion で作成された画像以外の通常の画像をアップロードする場合、パラメーターは照会されません。
通常の画像を基に新しい画像を作成する方法を教えてください。すぐに プロンプト
抽出できます。これからは、その画像 プロンプト
それを抽出する方法を教えます。
方法は簡単です。入門書 img
タブから目的の画像をアップロードします インテロゲートクリップ
、 ディープ・ブールを尋問しろ
機能を使う プロンプト
抽出できます。
インテロゲートクリップ
画像の特徴を文章として出力します。(6 GB 以上の VRAM のリソースを使用することをお勧めします)。
ディープ・ブールを尋問しろ
の場合、画像の特徴はカンマで区切られた複数の単語として出力されます。
ステーブルディフュージョンを実行するには、高性能の GPU リソースが必要です。ステーブル・ディフュージョン 1.5 には少なくとも 4 GB の VRAM が必要で、ステーブル・ディフュージョン XL には少なくとも 8 GB の VRAM が必要です。
これらの仕様を満たすGPUを個人で構築することは非常に困難です。 🥺 しかし、私たちにとっては AIを実行してください ✨あります AI を実行する安定拡散を手軽に使ってみよう!
新しいRunyour AIの使用方法は、以下のチュートリアルリンクにアクセスして確認できます。
次回はまた投稿でお会いして、有益で有益な情報を共有しましょう!🙌
ありがとうございます。