おはこんばんにちは、nabelogです。
最近AIのサービスがたくさんあってわけがわからないですよね。
今回はさらにわからなくなる話になるかもしれませんが、話題のConfiUIについて解説していこうと思います。
ConfyUIとは

ComfyUI(コンフィーUI)は、Stable Diffusionベースの画像生成モデルをノードベースのワークフローで操作できるオープンソースのGUIツールです。
Pythonベースで動作し、ブラウザ上からノードをつなぐだけで複雑なプロンプト処理、画像生成、LoRA、アップスケール、動画化などが可能です。
簡単に言えば細かなチューニングができるようなサービスです。
ダウンロードは以下からおこなってください。

初期設定

起動したらこんな感じ
うーん
こういう画面嫌いです。

でこのような画面になりました。
よかった。
UIは要素があってそれを線でワークをつなげるってイメージかな。

とりあえずモデルを入れないといけないのでダウンロードします。

ちなみに右上にある☆のマークをクリックすると何かよくわからない英語が出てきますがこちらからでもダウンロードが可能です。

次にユーザー登録をしましょう。
画面右上のアイコンをクリックすると色々メニューが出てきますので設定を押してください。

設定を押すと上記のような画面がでますのでユーザをクリックしてアカウントを作成してください。
googleアカウントであれば簡単に登録できます。

次にクレジットを購入します。(今回は有料課金しましたが無料でも使用できます。)
実際に使ってみよう

全ての起点は左上のアイコンからで、テンプレート参照をクリックすると上記の画面が表示されます。
左側のメニューで画像生成や動画生成、3D生成やaudio生成なども選択できます。

画像APIをクリックして赤枠のものを選んでみました。

まずはこのまま中央下部の「実行する」をクリックしてどんなものができるかやってみます。

何か出てきました。
エッフェル塔ですね。プロンプトにはそのような内容が描かれていたのですね。作り方などもわかってきました 。
今回の画像の生成料金は$0.167ですね150円換算で25円なんですね。従量課金だと料金がわかる分実行するのに躊躇しますね。

それにしても25円でこのようなイラストが手品のように簡単に生成できるのは素晴らしい時代になりましたね。
でも画像については大体わかったので、次は動画に挑戦してみようと思います。
動画を作る

テンプレート参照から動画APIをクリックして赤枠のものを選択します。

動画も画像APIと同じUIですね。フローを見ると画像を右側にアップロードして
黄色の箇所でどのような動きをするのかを入力して実行するをクリック
こんな感じで動画が出来上がるのですね。
ではさっそくやってみます。

$1.4かー。210円もかかるやん。
この金額でガチャ失敗したら嫌だな。精度が高いことを祈る
で生成された動画がこちら
なかなかよくできてきる。しかも5秒という時間破綻することなく歩いています。主役以外の人間もランダムに動いていて自然です。素晴らしい

では次にこの女性を振り向かせて笑っている動画を作ってもらいました。
めちゃくちゃ可愛い。
ComfyUIの特徴
ここまではどのサービスでもできるが、このcomfyUIは一度作成したフローをそのまま補完できるので再利用が可能です。
また、途中でノード(線みたいなもの)を順番に紐づけて、生成を自動化させることも可能です。
使い方次第ではとても便利なツールです。
まとめ
というわけで今回は、話題のComfyUIを使って画像や動画を生成してみました。
正直、最初は「なにこのUI……」ってなるかもしれません。
でも、テンプレートを使えば初心者でも「画像生成 → 動画生成」までスムーズに体験できるし、ノードのつながりを見てるうちに、
「あ、ここで画像を取り込んで、ここで加工して、ここで保存してるんだ!」
みたいに中身がわかるようになってくるんですよね。
ComfyUIの魅力を改めてまとめると…
- ノードでワークフローを“見える化”できる
- 一度作ったフローは何度でも使い回せる
- LoRAやControlNet、動画生成、3D系など多機能対応
- カスタマイズ性が超高いので、使い込むと“自分だけの工房”に
- GUIでできるので、コード書けなくても触れる!
料金について
料金についてはAPIを使用するので完全に従量課金制です。
動画を10回生成すると2500円程度の費用が単純に発生します。
定額制を選択するか自分でカスタマイズしたAIを使用するかはお財布との相談になりそうですね。


