【画像作成AI】NSFWフィルタを無効化したいのでStable Diffusionをローカルに構築

2022-09-032023-11-16

少し前からテキストや画像から新しく画像を生成してくれるAI、Stable Diffusionのローカルインストール方法やアプリが公開されています。

正直、ちょっと使ってみるだけの場合はアプリやwebサービスを使った方が環境構築も無く、早く便利に使えます。

ですが、Stable Diffusionの初期設定ではNSFW（職場閲覧注意）フィルタが入っています。

試してみるだけでは問題ありませんが、やっぱりフィルタを無効化した結果も知りたいと思ってしまうのは私だけでしょうか？

なので、フィルタを無効化した画像を作りたいだけでローカル環境を作りました。

と言うか、それ以外はローカル環境を作るメリットが無いかもしれません…。

Contents

1. 環境構築の手順（参考サイト）
- 1.1. 1からStable Diffusion実行環境を構築
- 1.2. 結果
2. NSFWフィルタの解除
- 2.1. 実行結果

環境構築の手順（参考サイト）

Google Colaboratoryを使った方法
- 画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ – GIGAZINE
GPUはあってもメモリが少ない場合のインストール（単精度モデルを使用）
- 【簡単】ローカル環境でstable-diffusionで実行する方法
倍精度モデルモデルを無理やりCPUで動かす方法
- Stable DiffusionをGPUなしのローカルPCで動かす – INOUE-KOBO.COM
Openvinoを使ってCPUで動かす方法
- Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法

最後のOpenvinoを使った方法は、更新の影響か参考サイト通りでは実行できませんでした。

1からStable Diffusion実行環境を構築

ハードウェア：GALLERIA GR2060RGF-T（CPU：Ryzen7 4800H、GPU：GeForce RTX 2060 GDDR 6GB）

2021年12月に買ったPCでGPUが載っていますが、メモリは6GBとStable Diffusionをそのまま使うには足りません。

そのため上記の「GPUはあってもメモリが少ない場合のインストール（単精度モデルを使用）」を参考にして環境を作ります。

Visual Studio Community 2022のインストール

CUDA Toolkitのインストールに必要になるため、先にコンパイラ（Visual Studio）をインストールします。

Visual Studioを使わない場合は開発環境のインストールだけでも問題ありませんが、良くわからなかったのでVisual Studio Community 2022をインストールしました。

Visual Studio 2022 コミュニティエディション – 最新の無料バージョンをダウンロー

CUDA Toolkitのインストール

2022年9月時点の最新はCUDA Toolkit 11.7ですが、PyTorchが11.6までの対応のためArchiveから11.6をインストールします。

Python開発環境の構築

四苦八苦しながら、何とかVisual Studio Codeで実行できるようになりました。

【初心者メモ】Visual Studio CodeでPython開発環境を整えるまでの手順。

モジュールのインストール

必要に応じてpipをアップデートしてください。

PyTorchのインストール（PyTorch公式：https://pytorch.org/）

python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

transformers・Diffusers・ftfyのインストール

python -m pip install transformers diffusers ftfy

学習済みモデルのダウンロードとテスト

参考サイト通りにHugging Faceのアカウント作成からアクセストークンを入手します。

【簡単】ローカル環境でStable Diffusionを実行する方法 | ジコログ

テストコード

こちらもprompt以外は参考サイト通りです（まだフィルタは無効化していません）。

promptはこちらを参考にしました。

import torch
from diffusers import StableDiffusionPipeline
from torch import autocast
 
MODEL_ID = "CompVis/stable-diffusion-v1-4"
DEVICE = "cuda"
YOUR_TOKEN = "コピーしたアクセストークン"
 
pipe = StableDiffusionPipeline.from_pretrained(MODEL_ID, revision="fp16", torch_dtype=torch.float16, use_auth_token=YOUR_TOKEN)
pipe.to(DEVICE)
 
prompt = "A young girl white hair in front of a fan of her bedroom, in a heat day, by dustin nguyen, akihiko yoshida, greg tocchini, greg rutkowski, cliff chiang, 4 k resolution, trending on artstation"
 
with autocast(DEVICE):
  image = pipe(prompt, guidance_scale=7.5)["sample"][0]
  image.save("test.png")