スマホで生成AI
萌え絵専用のイラスト生成AI「にじジャーニー(niji・Journey)」がスマホアプリを配信開始。
さっそくいじってみたのですが、
ごくシンプルなプロンプトでもめちゃんこキューティーな萌え絵が生成されて驚きました。
ただ、このアプリは最初の20回が無料でその後はサブスク制となっています。
生成しまくることを念頭に置くとなかなか常用は難しそう。
とはいえGoogle ColaboratoryやVPSに環境構築するよりは安上がりかも?
イラスト生成AIといえば、OpenAIが開発した「DALL-E」も話題になっていますね。
Microsoft Bingではさっそく無料で使うことができるようになっています。
こちらはChatGPTとの連携で動くので当初から日本語のプロンプトが使えるのが強み。
この汎用性の高さなら普通に今後のスタンダードになっていきそう。
いよいよStable Diffusion一強の時代も終わりつつあるのでしょうか。
ただ、これらはローカルで実行できないという欠点があり、
オープンソースであるStable Diffusionもそれはそれで需要があるのは言うまでもありません。
特にユーザーの好きなようにモデルをいじりたい場合などは依然としてStable Diffusion一択です。
それをスマホで実現する「Draw Things」も応援しているのですが、
個人開発ということもあってまだまだ発展途上という感じが否めないのは仕方ないですね。
Stable Diffusionは登場当初こそ驚かれましたが、
素の状態でのクオリティは次々に登場した後発サービスにかなり劣っているのが実情であり、
高品質イラストのみを出力するように特化したLoRAやEasyPromptなどのツール、
あるいは日本語プロンプトを使えるようにするプラグインなどが必須になってきます。
そこまで求めるとやはり必然的にハイスペックPCは必須という話になってくるため、
Stable Diffusionに手軽さを求めるのはまだまだ難しい段階だと思います。
にじジャーニーやDALL-Eなど後発の商用サービスがその穴を埋めているのが現状かと。
ただ、これを機に再びDraw Thingsをいじってみたところ、
前回匙を投げたLoRAの導入については自分が根本的に勘違いしていたみたいで、
Civitaiなどで配布している学習済みモデルはLoRAではなく
あくまでモデルとして読み込ませることで難なく生成させることができるようになりました。
iPhone 12でもステップ数30程度ならそれなりのスピード感で生成できるため、
連続生成こそ難しいものの隙間時間にプロンプトを吟味するのには使えそうです。
プロンプトなどが確定した上での一括生成はやはりPCにお任せするのが一番ですが、
それはそれで手軽にいつどこでも出力できる環境は確立しておきたかったんですよね。
まあ面倒なことはさておきにじジャーニーに課金してしまうのもひとつの手ではあるか。
にじジャーニーは他ユーザーの作品が絶え間なく流れてきて簡単にプロンプトをコピペできるので、
「どういうプロンプトが適切なのか分からない」という段階ではむしろこっちの方がいいかも。
個人的に生成AI周りは今年不本意に停滞してしまった感があるので、
2024年に入ってこれに打ち込めるだけの余裕を取り戻したらぜひ本格的に動きたいところです。