stable-diffusion-webui-japanese

Stable Diffusion web UI

Gradioライブラリを使って実装されたStable Diffusionのウェブインターフェース。

Features

画像付き詳細機能ショーケース：

stable diffusion easierの後継ソフト
オリジナルの txt2img と img2img モード
ワンクリックインストールでスクリプトを実行
アウトペインティング
インペインティング
カラースケッチ
プロンプトマトリックス
Stable Diffusion Upscale
Attention, モデルがより注意を払うべきテキストの部分を指定
- a man in a ((tuxedo)) - タキシードにより注意を払う
- a man in a ((tuxedo:1. 21)) - 代替構文
- テキストを選択して Ctrl+Up または Ctrl+Down (MacOS の場合は Command+Up または Command+Down) を押すと、選択したテキストの注目度を自動的に調整する (匿名ユーザーによるコード)
ループバック、img2img の処理を複数回実行する
X/Y/Z プロット、異なるパラメータを持つ画像の3次元プロットを描画する方法
テキストの反転
- 好きなだけ埋め込みを持ち、好きな名前を使うことができる
- トークンごとに異なるベクトル数を持つ複数の埋め込みを使うことができる
- 半精度浮動小数点数で動作する
- 8GBで埋め込みを学習することができる（6GBで動作したという報告もある）
Extras タブ：
- GFPGAN, 顔を修正するニューラルネットワーク
- CodeFormer, GFPGAN の代替となる顔復元ツール
- RealESRGAN, ニューラルネットワークアップスケーラ
- ESRGAN, サードパーティ製モデルを多数含むニューラルネットワークアップスケーラ
- SwinIR and Swin2SR (こちらを参照), ニューラルネットワークアップスケーラ
- LDSR, latent diffusion超解像アップスケーリング
アスペクト比のリサイズオプション
サンプリング方法の選択
サンプラーのエータ値（ノイズ乗数）の調整
より高度なノイズ設定オプション
いつでも処理の中断が可能
4GBビデオカードのサポート（2GBでも動作報告あり)
- バッチの正しいシード
ライブプロンプトトークンの長さの検証
生成パラメータ
- 画像生成に使用したパラメータはその画像と共に保存される
- PNGの場合はPNG chunks、 PNG の場合は PNG チャンクに、JPEG の場合は EXIF に
- 画像を PNG 情報タブにドラッグすると、生成パラメータが復元され、自動的に UI にコピーされます
- 設定で無効にできます
- 画像/テキストパラメータをプロンプトボックスにドラッグ＆ドロップ
生成パラメータの読み込みボタン、プロンプトボックスのパラメータを UI にロード
設定ページ
UI から任意の python コードを実行（有効にするには --allow-code で実行する必要があります）
ほとんどの UI 要素のマウスオーバーヒント
テキスト設定により UI 要素のデフォルト値/ミックス値/最大値/ステップ値を変更可能
タイリングのサポート、テクスチャのようにタイル化できる画像を作成するためのチェックボックス
プログレスバーとライブ画像生成プレビュー
- 別個のニューラルネットワークを使用して、VRAMや計算量をほとんど必要とせずにプレビューを生成できます
ネガティブプロンプト、生成された画像で見たくないものをリストアップできる追加のテキストフィールド
スタイル、プロンプトの一部を保存して、後でドロップダウンから簡単に適用する方法
バリエーション、同じ画像を生成する方法ですが、小さな違いがあります
Seed resizing: 同じ画像を少し異なる解像度で生成する方法
CLIP interrogator: 画像からプロンプトを推測しようとするボタン
Prompt Editing: 生成の途中でプロンプトを変更する方法、例えばスイカを作り始めて途中でアニメの女の子に切り替える
Batch Processing: img2img
Img2img Alternative、逆オイラー法による交差注意制御
Highres Fix, 通常の歪みなしにワンクリックで高解像度の画像を生成する便利なオプション
Reloading checkpoints on the fly
Checkpoint Merger, 最大3つのチェックポイントを1つにマージできるタブ
Custom scripts、コミュニティからの多くの拡張機能付き
Composable-Diffusion, 複数のプロンプトを同時に使用する方法
- 大文字の AND を使ってプロンプトを分ける
- プロンプトの重み付けもサポート： a cat :1.2 AND a dog AND a penguin :2.2
プロンプトのトークン制限なし (オリジナルの stable diffusion では 75 トークンまで使用可能)
DeepDanbooru の統合、アニメのプロンプトに danbooru スタイルのタグを作成
xformers, select cards の大幅な速度向上: (--xformers をコマンドラインの引数に追加)
拡張機能経由：履歴タブ：UI内で便利に画像を表示、直接表示、削除
Generate foreverオプション
Trainingタブ
- ハイパーネットワークとエンベッディングオプション
- 画像の前処理：トリミング、ミラーリング、BLIPまたはdeepdanbooru（アニメ用）を使った自動タグ付け
クリップスキップ
ハイパーネットワーク
Loras（Hypernetworks と同じですが、よりきれいです）
プロンプトに追加するエンベッディング、ハイパーネットワーク、Lorasをプレビュー付きで選択できる独立したUI
設定画面から別のVAEを読み込むように選択可能
プログレスバーに表示される推定完了時間
API
専用インペインティングモデルのサポート by RunwayML
拡張機能経由： Aesthetic Gradients、クリップ画像を埋め込むことで特定の美的感覚を持った画像を生成する方法 (https://github.com/vicgalle/stable-diffusion-aesthetic-gradientsの実装)
Stable Diffusion 2.0をサポート - 使い方はwikiを参照
Alt-Diffusionのサポート - 使い方はwikiを参照
悪い文字がなくなりました！
Safetensors フォーマットでチェックポイントをロード
解像度の制限を緩和: 生成されるイメージの寸法は 64 ではなく 8 の倍数でなければなりません
ライセンスが付きました！
設定画面からUIの要素を並び替える
Segmind Stable Diffusionをサポート。

Installation and Running

オンラインサービス一覧

Installation on Windows 10/11 using release package

Installation on Linux

依存関係をインストールする：

# Debianベース:
sudo apt install wget git python3 python3-venv libgl1 libglib2. 0-0
# Red Hat ベース:
sudo dnf install wget git python3 gperftools-libs libglvnd-glx
# openSUSE ベース:
sudo zypper install wget git python3 libtcmalloc4 libglvnd
# Arch ベース:
sudo pacman -S wget git python3

システムが新しい場合、python3. 11 or python3.10: ```bash

Ubuntu 24.04

sudo add-apt-repository ppa:deadsnakes/ppa sudo apt update sudo apt install python3.11

Manjaro/Arch

sudo pacman -S yay yay -S python311 # python3.11 パッケージと混同しないように

3.11 用のみ

その後起動スクリプトで env 変数を設定

export python_cmd=”python3.11”

or in webuii-user.sh

python_cmd=”python3.11”

2. webui をインストールしたいディレクトリに移動し、以下のコマンドを実行します：
```bash
wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh

あるいは、

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

webui.sh を実行する。
webui-user.sh のオプションを確認してください。

Installation on Apple Silicon

説明書はこちら。

Contributing

このリポジトリにコードを追加する方法は以下の通りです：貢献

Documentation

ドキュメントはこのREADMEからプロジェクトのwikiに移動しました。

Googleや他の検索エンジンにwikiをクロールしてもらうために、ここに（人間用ではない）クロール可能なwikiへのリンクがあります。

Credits

借用したコードのライセンスは Settings -> Licenses 画面、および html/licenses.html ファイルで確認できます。

Stable Diffusion - https://github.com/Stability-AI/stablediffusion, https://github.com/CompVis/taming-transformers, https://github.com/mcmonkey4eva/sd3-ref
k-diffusion - https://github.com/crowsonkb/k-diffusion.git
Spandrel - https://github.com/chaiNNer-org/spandrel implementing
- GFPGAN - https://github.com/TencentARC/GFPGAN.git
- CodeFormer - https://github.com/sczhou/CodeFormer
- ESRGAN - https://github.com/xinntao/ESRGAN
- SwinIR - https://github.com/JingyunLiang/SwinIR
- Swin2SR - https://github.com/mv-lab/swin2sr
LDSR - https://github.com/Hafiidz/latent-diffusion
MiDaS - https://github.com/isl-org/MiDaS
Ideas for optimizations - https://github.com/basujindal/stable-diffusion
クロスアテンションレイヤーの最適化 - Doggettx - https://github.com/Doggettx/stable-diffusion、迅速な編集のためのオリジナルアイデア。
クロスアテンションレイヤーの最適化 - InvokeAI, lstein - https://github.com/invoke-ai/InvokeAI (元々は http://github.com/lstein/stable-diffusion)
サブ2次クロスアテンションレイヤーの最適化 - Alex Birch (https://github.com/Birch-san/diffusers/pull/1), Amin Rezaei (https://github.com/AminRezaei0x443/memory-efficient-attention)
テキストの反転 - Rinon Gal - https://github.com/rinongal/textual_inversion (彼のコードは使っていないが、彼のアイデアは使っている)。
SDアップスケールのアイデア - https://github.com/jquesnelle/txt2imghd
ノイズ生成 for アウトペインティング mk2 - https://github.com/parlance-zz/g-diffuser-bot
CLIP interrogator idea and borrowing some code - https://github.com/pharmapsychotic/clip-interrogator
Idea for Composable Diffusion - https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch
xformers - https://github.com/facebookresearch/xformers
DeepDanbooru - interrogator for anime diffusers https://github. com/KichangKim/DeepDanbooru
float16 UNetからfloat32精度でサンプリング - アイデアはmarunineさん、Diffusersの実装例はBirchさん (https://github.com/Birch-san/diffusers-play/tree/92feee6)
pix2pixを教える - Tim Brooks (star), Aleksander Holynski (star), Alexei A. Efros (no star) - https://github.com/timothybrooks/instruct-pix2pix
セキュリティアドバイス - RyotaK
UniPCサンプラー - Wenliang Zhao - https://github. com/wl-zhao/UniPC
TAESD - Ollin Boer Bohan - https://github.com/madebyollin/taesd
LyCORIS - KohakuBlueleaf
Restart sampling - lambertae - https://github.com/Newbeeer/diffusion_restart_sampling
Hypertile - tfernd - https://github.com/tfernd/HyperTile
Initial Gradio script - Anonymous userによって4chanに投稿されました。匿名ユーザーさん、ありがとうございます。
(あなた)

This site is open source. Improve this page.