sd-scripts

English / 日本語

はじめに
ドキュメント
AIコーディングエージェントを使う開発者の方へ
Windows環境でのインストール
Linux/WSL2環境でのインストール
- DeepSpeedのインストール（実験的、LinuxまたはWSL2のみ）
アップグレード
- PyTorchのアップグレード
謝意
ライセンス

はじめに

Stable Diffusion等の画像生成モデルの学習、モデルによる画像生成、その他のスクリプトを入れたリポジトリです。

スポンサー

このプロジェクトを支援してくださる企業・団体の皆様に深く感謝いたします。

スポンサー募集のお知らせ

このプロジェクトがお役に立ったなら、ご支援いただけると嬉しく思います。 GitHub Sponsorsで受け付けています。

更新履歴

Version 0.10.1 (2026-02-13):
- Anima PreviewモデルのLoRA学習およびfine-tuningをサポートしました。PR #2260 およびPR #2261
- 素晴らしいモデルを公開された CircleStone Labs、および PR #2260を提出していただいたduongve13112002氏に深く感謝します。
- 詳細はドキュメントをご覧ください。
Version 0.10.0 (2026-01-19):
- sd3ブランチをmainブランチにマージしました。このバージョンからFLUX.1およびSD3/SD3.5等のモデルがmainブランチでサポートされます。
- ドキュメントにはまだ不備があるため、お気づきの点はIssue等でお知らせください。
- sd3ブランチは当面、devブランチと同期して開発ブランチとして維持します。

サポートモデル

Stable Diffusion 1.x/2.x
SDXL
SD3/SD3.5
FLUX.1
LUMINA
HunyuanImage-2.1

機能

LoRA学習
fine-tuning（DreamBooth）：HunyuanImage-2.1以外のモデル
Textual Inversion学習：SD/SDXL
画像生成
その他、モデル変換やタグ付け、LoRAマージなどのユーティリティ

ドキュメント

学習ドキュメント（英語および日本語）

日本語は折りたたまれているか、別のドキュメントにあります。

その他のドキュメント

旧ドキュメント（日本語）

学習について、共通編 : データ整備やオプションなど
DreamBoothの学習について

AIコーディングエージェントを使う開発者の方へ

This repository provides recommended instructions to help AI agents like Claude and Gemini understand our project context and coding standards.

To use them, you need to opt-in by creating your own configuration file in the project root.

Quick Setup:

Create a CLAUDE.md and/or GEMINI.md file in the project root.
Add the following line to your CLAUDE.md to import the repository's recommended prompt:
```
@./.ai/claude.prompt.md
```
or for Gemini:
```
@./.ai/gemini.prompt.md
```
You can now add your own personal instructions below the import line (e.g., Always respond in Japanese.).

This approach ensures that you have full control over the instructions given to your agent while benefiting from the shared project context. Your CLAUDE.md and GEMINI.md are already listed in .gitignore, so they won't be committed to the repository.

このリポジトリでは、AIコーディングエージェント（例：Claude、Geminiなど）がプロジェクトのコンテキストやコーディング標準を理解できるようにするための推奨プロンプトを提供しています。

それらを使用するには、プロジェクトディレクトリに設定ファイルを作成して明示的に有効にする必要があります。

簡単なセットアップ手順:

プロジェクトルートに CLAUDE.md や GEMINI.md ファイルを作成します。
CLAUDE.md に以下の行を追加して、リポジトリの推奨プロンプトをインポートします。
```
@./.ai/claude.prompt.md
```
またはGeminiの場合:
```
@./.ai/gemini.prompt.md
```
インポート行の下に、独自の指示を追加できます（例：常に日本語で応答してください。）。

この方法により、エージェントに与える指示を各開発者が管理しつつ、リポジトリの推奨コンテキストを活用できます。CLAUDE.md および GEMINI.md は .gitignore に登録されているため、リポジトリにコミットされることはありません。

Windows環境でのインストール

Windowsでの動作に必要なプログラム

Python 3.10.xおよびGitが必要です。

Python 3.10.x: https://www.python.org/downloads/windows/ からWindows installer (64-bit)をダウンロード
git: https://git-scm.com/download/win から最新版をダウンロード

Python 3.11.x、3.12.xでも恐らく動作します（未テスト）。

PowerShellを使う場合、venvを使えるようにするためには以下の手順でセキュリティ設定を変更してください。（venvに限らずスクリプトの実行が可能になりますので注意してください。）

PowerShellを管理者として開きます。
「Set-ExecutionPolicy Unrestricted」と入力し、Yと答えます。
管理者のPowerShellを閉じます。

インストール手順

PowerShellを使う場合、通常の（管理者ではない）PowerShellを開き以下を順に実行します。

git clone https://github.com/kohya-ss/sd-scripts.git
cd sd-scripts

python -m venv venv
.\venv\Scripts\activate

pip install torch==2.6.0 torchvision==0.21.0 --index-url https://download.pytorch.org/whl/cu124
pip install --upgrade -r requirements.txt

accelerate config

コマンドプロンプトでも同一です。

（なお、python -m venv～の行で「python」とだけ表示された場合、py -m venv～のようにpythonをpyに変更してください。）

注：bitsandbytes、prodigyopt、lion-pytorch は requirements.txt に含まれています。

この例ではCUDA 12.4版をインストールします。異なるバージョンのCUDAを使用する場合は、適切なバージョンのPyTorchをインストールしてください。たとえばCUDA 12.1版の場合は pip install torch==2.6.0 torchvision==0.21.0 --index-url https://download.pytorch.org/whl/cu121 としてください。

accelerate configの質問には以下のように答えてください。（bf16で学習する場合、最後の質問にはbf16と答えてください。）

- This machine
- No distributed training
- NO
- NO
- NO
- all
- fp16

※場合によって ValueError: fp16 mixed precision requires a GPU というエラーが出ることがあるようです。この場合、6番目の質問（ What GPU(s) (by id) should be used for training on this machine as a comma-separated list? [all]:）に「0」と答えてください。（id 0のGPUが使われます。）

requirements.txtとPyTorchについて

PyTorchは環境によってバージョンが異なるため、requirements.txtには含まれていません。前述のインストール手順を参考に、環境に合わせてPyTorchをインストールしてください。

スクリプトはPyTorch 2.6.0でテストしています。PyTorch 2.6.0以降が必要です。

RTX 50シリーズGPUの場合、PyTorch 2.8.0とCUDA 12.8/12.9を使用してください。requirements.txtはこのバージョンでも動作します。

xformersのインストール（オプション）

xformersをインストールするには、仮想環境を有効にした状態で以下のコマンドを実行してください。

pip install xformers --index-url https://download.pytorch.org/whl/cu124

必要に応じてCUDAバージョンを変更してください。一部のGPUアーキテクチャではxformersが利用できない場合があります。

Linux/WSL2環境でのインストール

LinuxまたはWSL2環境でのインストール手順はWindows環境とほぼ同じです。venv\Scripts\activate の部分を source venv/bin/activate に変更してください。

※NVIDIAドライバやCUDAツールキットなどは事前にインストールしておいてください。

DeepSpeedのインストール（実験的、LinuxまたはWSL2のみ）

DeepSpeedをインストールするには、仮想環境を有効にした状態で以下のコマンドを実行してください。

pip install deepspeed==0.16.7

アップグレード

新しいリリースがあった場合、以下のコマンドで更新できます。

cd sd-scripts
git pull
.\venv\Scripts\activate
pip install --use-pep517 --upgrade -r requirements.txt

コマンドが成功すれば新しいバージョンが使用できます。

PyTorchのアップグレード

PyTorchをアップグレードする場合は、Windows環境でのインストールのセクションのpip installコマンドを参考にしてください。

謝意

LoRAの実装はcloneofsimo氏のリポジトリを基にしたものです。感謝申し上げます。

Conv2d 3x3への拡大は cloneofsimo氏が最初にリリースし、KohakuBlueleaf氏が LoCon でその有効性を明らかにしたものです。KohakuBlueleaf氏に深く感謝します。

ライセンス

スクリプトのライセンスはASL 2.0ですが（Diffusersおよびcloneofsimo氏のリポジトリ由来のものも同様）、一部他のライセンスのコードを含みます。

Memory Efficient Attention Pytorch: MIT

bitsandbytes: MIT

BLIP: BSD-3-Clause

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

sd-scripts

目次

はじめに

スポンサー

スポンサー募集のお知らせ

更新履歴

サポートモデル

機能

ドキュメント

学習ドキュメント（英語および日本語）

その他のドキュメント

旧ドキュメント（日本語）

AIコーディングエージェントを使う開発者の方へ

Windows環境でのインストール

Windowsでの動作に必要なプログラム

インストール手順

requirements.txtとPyTorchについて

xformersのインストール（オプション）

Linux/WSL2環境でのインストール

DeepSpeedのインストール（実験的、LinuxまたはWSL2のみ）

アップグレード

PyTorchのアップグレード

謝意

ライセンス

Uh oh!

FilesExpand file tree

README-ja.md

Latest commit

History

README-ja.md

File metadata and controls

sd-scripts

目次

はじめに

スポンサー

スポンサー募集のお知らせ

更新履歴

サポートモデル

機能

ドキュメント

学習ドキュメント（英語および日本語）

その他のドキュメント

旧ドキュメント（日本語）

AIコーディングエージェントを使う開発者の方へ

Windows環境でのインストール

Windowsでの動作に必要なプログラム

インストール手順

requirements.txtとPyTorchについて

xformersのインストール（オプション）

Linux/WSL2環境でのインストール

DeepSpeedのインストール（実験的、LinuxまたはWSL2のみ）

アップグレード

PyTorchのアップグレード

謝意

ライセンス