• このエントリーをはてなブックマークに追加
Vol.549 結城浩/AIシステム「Stable Diffusion」で楽しむ美しい画像の世界
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

Vol.549 結城浩/AIシステム「Stable Diffusion」で楽しむ美しい画像の世界

2022-10-04 07:00
    Vol.549 結城浩/AIシステム「Stable Diffusion」で楽しむ美しい画像の世界

    結城浩の「コミュニケーションの心がけ」2022年10月4日 Vol.549


    はじめに

    こんにちは、結城浩です。

    今回の結城メルマガVol.549は、文章から画像を作るAIシステム「Stable Diffusion」特集号です。

    これまでの結城メルマガでは、文章から画像を作るAIシステムDALL-E(ダリ)とmidjourney(ミッドジャーニー)を紹介しました。

    ◆Vol.541: DALL-E: 短い文章から驚くほどリアルな画像を作るAIシステム
    https://link.hyuki.net/mm541

    ◆Vol.545: midjourney: AIシステム「midjourney」が作り出す美しい画像の世界
    https://link.hyuki.net/mm545

    結城は今でもこれらのAIシステムを使っていますが、現在夢中になっているのはStable Diffusion(ステーブル・ディフュージョン)です。2022年9月だけでたぶん一万枚以上の画像を生成しているはずです。

    ◆CompVis/stable-diffusion: A latent text-to-image diffusion model
    https://github.com/CompVis/stable-diffusion

    DALL-EはWebサービスとして動かし、またmidjourneyはDiscordのbotとして動かしますが、Stable Diffusionは「ローカルな環境で動かせる」という大きな特徴があります。ネットワークを介さず、無料でいくらでも画像を生成できるのです。

    おもしろそうなので結城も自分のM1 MacBook Proで動かして、たくさんの画像を作ってみました。あまりにも楽しいので、世界中のクリエイタが作品をホスティングするArtStationにアカウントを作り、そこにStable Diffusionで作った画像のうちほんの一部を並べています。ぜひごらんください。

    ◆ArtStation - Hiroshi Yuki
    https://www.artstation.com/hyuki0000

    ◆結城浩のArtStation(公開作品の一部)

    20221001125814-26434f63987bea4c.png

    先ほど「一万枚以上の画像を生成」といっている割にはArtStationで公開している画像は多くありません。でも実は、一枚の画像を作品として仕上げるまでに大量の画像を作っているのです。

    今回の結城メルマガでは、結城がどんなふうにしてStable Diffusionを楽しんでいるかをご紹介しようと思います。技術的な詳細には入りませんが、以下の「冬の女王」という作品を作っていく流れをお話しします。

    ◆結城がStable Diffusionで作った「冬の女王」(完成版)

    20220927121158-258671619c685884.png

    * * *

    ところで、Googleより、テキストから3Dモデルを生成するDreamFusionというAIシステムが公開されて話題になっています。DALL-E, midjourney, Stable Diffusionは2D画像を生成するのに対して、DreamFusionは3Dモデルを生成するのです。

    ◆DreamFusion: Text-to-3D using 2D Diffusion
    https://dreamfusion3d.github.io/

    また、Metaは、テキストから動画を生成するMake-A-VideoというAIシステムを公開しています。

    ◆Introducing Make-A-Video: An AI system that generates videos from text
    https://ai.facebook.com/blog/generative-ai-text-to-video/

    テキストを何かに変換するシステムを「Text-to-何か」と表現するなら、以下のようにまとめられるでしょう。

    • Text-to-Image: DALL-E, midjourney, Stable Diffusion
    • Text-to-3D: DreamFusion
    • Text-to-Video: Make-A-Video

    AIシステムが生成するオブジェクトは今後もますます多様化、高品質化していくことはまちがいありません。おもしろい時代になってきましたね!

    * * *

    それでは今回の結城メルマガもどうぞごゆっくりお読みください。


    目次

    • AIシステム「Stable Diffusion」で楽しむ美しい画像の世界
     
    この記事は有料です。記事を購読すると、続きをお読みいただけます。
    ニコニコポイントで購入

    続きを読みたい方は、ニコニコポイントで記事を購入できます。

    入会して購読

    この記事は過去記事の為、今入会しても読めません。ニコニコポイントでご購入下さい。

    コメントを書く
    コメントをするには、
    ログインして下さい。