大将がゆく

写真を撮ったり、イラストを描いたり……日本一周の旅をした主夫の日記帳

画像生成AIは“カメラ”かもしれない

昨日から画像生成AI「DreamStudio」で遊んでいましたが、あっという間に無料分の200クレジットを使い切りました。

気軽に無限に使える環境を構築する

無料で最新AIを使える時代に突入していました。科学の力ってスゲー!!

なので今日からは無償版の「Stable Diffusion」をGoogle Colabで使えるようにし、費用ゼロで無限にさまざまな“呪文”を試せる環境を手に入れました。

この具体的な手順はさまざまなブログやWeb媒体で紹介されているので、ここでは参考にした記事をリンクするに留めておきます。

Stable Diffusionによる画像生成をGoogle Colabでやってみる | cedro-blog

Google Colab で はじめる Stable Diffusion v1.4|npaka|note

画像生成AI「Stable Diffusion」をGoogle Colabで動かしたメモ - ただいま村

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE

※順不同。基本的にどの記事も同じ作業手順になります

Google Colabを介すればハイスペックPCを用意する必要がありませんし、なんといっても環境構築に要するスキルや作業量が桁違いに楽だと感じました。

“呪文”の作成でスキルが問われる?

さて、Stable Diffusionではプロンプトと呼ばれる命令文を入力してAIに描いてもらうわけですが、ここで文章力が試されます。しかも英語です。

世界中で投稿されているAIが生成したイラストを見てみると、どれも長文でかなり詳細にイメージを伝えられています。

自力で英作文をして呪文を編み出し、錬成した肖像画です

たとえば、上掲の肖像画は"portrait of aged man, hyper realistic pencil drawing, dramatic lighting from side, taken by EF85mm F1.4L IS USM"という呪文を(とても頑張って)作文しました。

全体としては

  1. 主題
  2. 画風やタッチ

の順で詠唱するといいようですが、画風やタッチを伝える部分では“英霊召喚”と呼ばれるdrawn by Leonardo da Vinciなどの絵画の巨匠の名前を唱えたり、taken by EF85mm F1.4L IS USMのように具体的なレンズ名で画角や背景のボケを表すことが効果的なようです。

こうしたAI構文は今後も研究が進んでいくとは思いますが、すでに気軽に呪文を作れるジェネレーターも出てきました。

AI で画像生成を生成 (フリースタイル)ジェネレーター|Catchy

ただ、現時点ではジェネレーターでは完全に自分が思い描いた光景を表現するような英文は出力されませんでした。

結局は、お約束を踏まえつつ、自力で英作文したほうがねらった画像を錬成できる確率が高いように感じます。

画像生成AIはカメラのようだ

画像生成AIは呪文(プロンプト)を人間が入力する必要があることから、やはり使い手によって出力結果の質が左右されそうな予感……。

でも、これってカメラにすごく近い性質なんじゃないかな?なんて思います。

今の時代、スマートフォンに搭載された状態で誰しもポケットの中に高性能なカメラを忍ばせています。

しかし、撮影者のスキルやセンスによって同じスマホで、同じ場所で撮影しても写真の出来栄えに差異が出てきますよね?

これと似ていて、誰でも使えるオープンソースのAIでも呪文ひとつで使い手の個性やクセを生めるのでは?

もう宮城県内の学校では夏休みが終わったらしいですが、僕はStable Diffusionを題材に自由研究したいと思います。

それじゃあ、また。