2023年6月9日金曜日

Stable Diffusionをする

 おじさん、特にStable Diffusionには興味ないんですが、c++用のAIライブラリをmake使わずにひたすらいろいろなプラットフォーム用移植する勉強の一環で、Stable DiffusionのC++版をスクラッチでフルビルドしてみました。


論文:High-Resolution Image Synthesis with Latent Diffusion Models", Rombach, R., Blattmann, A., Lorenz, D., Esser, P., Ommer, B. (CVPR'22)

https://arxiv.org/abs/2112.10752


論文解説

https://zenn.dev/tomo_makes/books/4ed97f06d02a38/viewer/142053


ソース

https://github.com/EdVince/Stable-Diffusion-NCNN


ncnnという中国語?のライブラリを使わないといけないのね。

txt2imgとかimg2imgとかいろんなものが含まれています。

これ本当に動くのかなぁ。





---------------------------------


----------------[  init   ]---------------- 6.21G / 6.22G

----------------[ prompt  ]---------------- 6.22G / 6.22G

----------------[ encoder ]---------------- 6.41G / 6.41G

----------------[diffusion]----------------

step: 1/37      102223.67ms

step: 2/37


---------------------------------


うーん、これWindowsでCPUのみで行うと、1stepに100秒かかります。

これ結果出すのに1時間かかるね。


なんかテストは少女を生成しないといけないようなので、生成してみました。

---------------------------------


---------------------------------

できた!



0 件のコメント:

コメントを投稿