結城浩の「コミュニケーションの心がけ」2022年10月4日 Vol.549
はじめに
こんにちは、結城浩です。
今回の結城メルマガVol.549は、文章から画像を作るAIシステム「Stable Diffusion」特集号です。
これまでの結城メルマガでは、文章から画像を作るAIシステムDALL-E(ダリ)とmidjourney(ミッドジャーニー)を紹介しました。
◆Vol.541: DALL-E: 短い文章から驚くほどリアルな画像を作るAIシステム
https://link.hyuki.net/mm541
◆Vol.545: midjourney: AIシステム「midjourney」が作り出す美しい画像の世界
https://link.hyuki.net/mm545
結城は今でもこれらのAIシステムを使っていますが、現在夢中になっているのはStable Diffusion(ステーブル・ディフュージョン)です。2022年9月だけでたぶん一万枚以上の画像を生成しているはずです。
◆CompVis/stable-diffusion: A latent text-to-image diffusion model
https://github.com/CompVis/stable-diffusion
DALL-EはWebサービスとして動かし、またmidjourneyはDiscordのbotとして動かしますが、Stable Diffusionは「ローカルな環境で動かせる」という大きな特徴があります。ネットワークを介さず、無料でいくらでも画像を生成できるのです。
おもしろそうなので結城も自分のM1 MacBook Proで動かして、たくさんの画像を作ってみました。あまりにも楽しいので、世界中のクリエイタが作品をホスティングするArtStationにアカウントを作り、そこにStable Diffusionで作った画像のうちほんの一部を並べています。ぜひごらんください。
◆ArtStation - Hiroshi Yuki
https://www.artstation.com/hyuki0000
先ほど「一万枚以上の画像を生成」といっている割にはArtStationで公開している画像は多くありません。でも実は、一枚の画像を作品として仕上げるまでに大量の画像を作っているのです。
今回の結城メルマガでは、結城がどんなふうにしてStable Diffusionを楽しんでいるかをご紹介しようと思います。技術的な詳細には入りませんが、以下の「冬の女王」という作品を作っていく流れをお話しします。
◆結城がStable Diffusionで作った「冬の女王」(完成版)
* * *
ところで、Googleより、テキストから3Dモデルを生成するDreamFusionというAIシステムが公開されて話題になっています。DALL-E, midjourney, Stable Diffusionは2D画像を生成するのに対して、DreamFusionは3Dモデルを生成するのです。
◆DreamFusion: Text-to-3D using 2D Diffusion
https://dreamfusion3d.github.io/
また、Metaは、テキストから動画を生成するMake-A-VideoというAIシステムを公開しています。
◆Introducing Make-A-Video: An AI system that generates videos from text
https://ai.facebook.com/blog/generative-ai-text-to-video/
テキストを何かに変換するシステムを「Text-to-何か」と表現するなら、以下のようにまとめられるでしょう。
- Text-to-Image: DALL-E, midjourney, Stable Diffusion
- Text-to-3D: DreamFusion
- Text-to-Video: Make-A-Video
AIシステムが生成するオブジェクトは今後もますます多様化、高品質化していくことはまちがいありません。おもしろい時代になってきましたね!
* * *
それでは今回の結城メルマガもどうぞごゆっくりお読みください。
目次
- AIシステム「Stable Diffusion」で楽しむ美しい画像の世界