This is Not here - *//LIKE TEARS IN RAIN

Fashion by AI

ファッションデザインと生産のためのオールインワン・プラットフォームであるCALAがDALL-Eを用いたデザインツールを提供するとBoFで書かれていますね。プロンプトから新しい服のデザインを生成したり、デザイン画像をアップロードしてそのバリエーションを作成したりできるとのこと。

AIの発達によってファッションデザイナーの仕事はどのように変わるのか?という問いについて、CALAの共同創業者でCEOのAndrew Wyattは、2017年にハーバード大学デザイン大学院で行われたVirgil Ablohの講演を引用して話しています。Virgil Ablohは自身のデザインツールがiPhoneであり、WhatsAppであると話しています。彼は世の中の物事の写真を撮り、それをデザインチームに送信し、デザインチームはそのインスピレーションをベースにデザインスケッチやリアルなレンダリング画像をVirgil Ablohに返してきます。彼は自分のコンセプトを服に変換するためのチームを持っていました。

Miuccia Pradaはスケッチをせず、代わりに彼女のアイデアを翻訳するスタッフを持っています。DiorでRaf Simonsは、イメージやインスピレーションを記したファイルを用意し、それを基にデザインチームがスケッチを制作していました。川久保玲もスケッチはせず、彼女のデザインはほとんど言葉とイマジネーションで行っていると言っています。
今日のトップデザイナーは、カッティングやドレーピングといった技術よりも、コンセプトを重視し、その概念化を行うクリエイティブ・ディレクターが多くなっています。

テキストやリファレンスとなる画像を用いたデザイン(text-to-image, image-to-image)は、実際に現在の"generative AI"が提供しているものです。Andrew Wyattによると、CALAはデザインチームや多くのスタッフを有していない人でもその能力を利用できるようにしようとしていると説明しています。

ポルトガルを拠点とするFashableは、AIを用いて新しいファッションデザインを生成することができる機能を開発しました。共同創業者でCEOのOrlando Ribas Fernandesによると、AIを用いると簡単にコレクションを作成することができ、実際にどのアイテムを製造するかを決定するための需要予測の目的でその画像を使うことができるようになると述べています。これにより、売れる製品だけを製造し、予算の無駄を減らすことができます。ただし、このモデルには、コレクションの発表から商品の生産・出荷までに時間がかかるという課題があります。

メタバースの世界構築プラットフォームであるStageverseが、Stable Diffusionを用いたアバター向けのAI生成ファッションデザインツールを発表したりと、多くの企業が自分たちのビジネスにAIを取り入れ始めていますね。AIでレバレッジを効かせやすいのは、既にアセットを持っているプラットフォーム企業となります。

"generative AI"は、小説からイラストやデザイン、作曲から映像制作といったものを属人的な手工業から切り離して工業化し、everything-to-everythingで容易に大量生産を可能にするという技術です。"generative AI"を前提にしたクリエイティブ・ディレクターに求められるのは、何をAIにインプットするのかという想像力と出力されたコンテンツを判断する審美眼、そして、それらにコンテキストを付与してパッケージング化する能力といったところですが、この辺りは現在のクリエイティブ・ディレクターが行っているディレクションとあまり変わらないというのはAndrew Wyattが指摘している通りといったところでしょうか。

Future of generative AI

Photography by Stable Diffusion

1億100万ドルを調達したStability AIですが、AWS上で4000以上のNVIDIA A100のGPUクラスターを使用しており(その後、その数は5400を超えた。)、クラウドの運用コストが5000万ドルを超えているという話がありますね。ただし、これはR&Dによって学習モデルのトレーニング等を効率化することで、費用圧縮ができるとEmad Mostaqueは主張しているとのこと。

同社の広報担当によるとIBMのRed HatやMongoDBといった大規模OSS企業と同様のビジネスモデルを想定しているようですね。一般消費者には無料版を提供し、大規模な顧客向けには有料のプレミアム版を提供するといった形式。そして、より長期的には多くのコミュニティやプロジェクトを通じて収益を上げていくことに関心を持っているようです。

Stability AIの資金調達の翌日に1億2500万ドルの資金調達を発表したのがAIコンテンツプラットフォームのJasperですが、同社はAIを用いてBlog記事用の文章やコピーライティングをサポートするサービス(OpenAIのGPT-3を利用。)を提供しています。
CEOで共同創業者のDave Rogenmoserが話しているようにAIは一過性のものではないでしょうね。最近、彼らはJasper Artも立ち上げています。あらゆるツールに"generative AI"が入り込み、コンテンツを生成し、人間にサジェストすることで生産性を高める方向に作用する流れ。AIがプログラミングをサポートしてくれるGitHub Copilot等もありますね。

Dave Rogenmoserは、よりニッチな形でAIはパッケージ化されていくと話しています。ファーストフード店のワークフローを改善するものや、法律業務を行うもの等、各分野に特化した学習モデル。もしくは、1企業1モデルといった感じで専用学習モデルを持っても良いのかもしれませんね。Dave Rogenmoserも話していますが、個人でも自分の声のトーンや文章ライティングを学習させたモデルを持てば便利に使うことができますね。
YouTuberがYouTubeに投稿した過去動画から学習モデルを自動生成でき、追加で動画を撮影しなくても指示さえすれば新作動画が自動生成できるようになれば、YouTubeは更にコンテンツ爆発を起こすことになるでしょう。文章、音声、映像、といったモデルの学習に使うことができるコンテンツを既に握っているプラットフォームは既存コンテンツと学習モデルでサブスク・ロックインさせればビジネスになりそうです。

AIは、無から有を生み出すのではなく、既存のアートワークの抽象的な特徴を数学的抽象表現を用いて分布させた多様体(manifold)をベースに、その多様体から入力されたプロンプト周辺の特徴量をランダムサンプリングし、複雑な確率論的近似によってパスティーシュしているという説明は概念として理解しやすいです。
記事の筆者はAIアートの問題点として、学習モデルのトレーニングにおける文化資本の搾取、クリエイティビティが身体性や関係性、社会文化的な文脈から切り離すことができるという考えが広まる、といったことを挙げつつも、クリエイティビティの諸問題よりも最大の懸念はAIの社会実装にあると述べています。

英国のBrexitや米国のDonald Trumpの大統領選挙で果たしたCambridge Analytica社の役割、米軍の戦闘用ドローンの強化や監視データの分析にGoogleのTensorFlowが使われたProject Maven、AmazonやNetflixからUber、Spotify、Airbnbに至るまでの労働力の自動搾取、アルゴリズム取引で発生した2010年のNYダウにおけるFlash Crash、Instagramの子供たちへの日常的な精神的暴力など、AIアートは北半球グローバルカントリーのPrediction Ideology(未来予測とその制御・支配を求めるイデオロギー)のためのソフトなプロパガンダであるとのこと。記事にはありませんでしたが、中国の芝麻信用も同じようなものですね。
アートにおける結論としては、予測不能な機械学習ツール、トレンドから外れたアートワーク等を挙げつつ、AIのハイプ・サイクルに乗らないアーティストが重要という話で締めくくられています。

既にネットも社会も中央集権プラットフォーマーによるアルゴリズムが支配する世界になっているため、結論としては特に目新しいものはないですね。
AIを用いれば更にソフィスティケートされたきめ細やかな安心安全スマート支配が可能になりますが、"generative AI"も含めて、結局、人間は快適さには抗えないので、そちらに流れていくことになるでしょうか。

Creative works beginning to be influenced by generative A.I.

画像は、Stable Diffusionで生成したChanelをイメージした架空のコレクション。
どこかで見たことあるような、無いような。でも、やっぱりどこかで見たことあるような、そんな感じになっているかなと。

ハイファッションの世界のような洗練と純化されたイメージは、元々CGやAI画像と相性は良いんですよね。

AIによって生成されたアートが既にクリエイティブワークに変化を起こし始めているという記事がNYTimesに出ていましたね。
AIとオートメーションによって反復的な肉体労働を伴うブルーカラー労働者がその職を失うというのがAI脅威論の広く流布されたイメージでしたが、クリエイティブクラスにその波が予想外に来ている、と。

GPT-3といったAIによるテキスト生成ツールを端緒に、画像を生成するDALL-E 2、Midjourney、Stable Diffusionと続き、現在は音楽や映像にまで"generative A.I."の波が押し寄せようとしている状況にあります。現時点でDALL-E 2は150万人を超えるユーザーがおり、毎日200万枚を超える画像を生成。Midjourneyは公式Discordサーバに300万人を超えるメンバーが登録しています。

"generative A.I."が変化を齎しているクリエイティブワークとして、"Twofer Goofer"を制作しているブルックリンのゲームデザイナーであるCollin Waldochの例では、人間のアーティストを雇う予算のない小規模プロジェクトではAIによるイメージ生成は有効であると説明されています。最初から人間のアーティストを雇う想定がなかったプロジェクトであれば、AIを使っても誰かの仕事を奪うということにはならないということ。これが意味するのは、AIがクリエイティブ業界全体の底上げに寄与するということですね。

サンフランシスコのインテリアデザイナーであるIsabella Orsiは、オフィスや自分の部屋の画像をアップロードしていろいろな雰囲気のインテリアイメージを生成することができる"Interior AI"を用いてクライアントにモックを作成したとのこと。AIはプロジェクトの初期段階でのアイデア出しに役立つと話しており、誰かがレンダリング画像の良し悪しを見分ける必要があるため、結局、AIが発達したとしてもデザイナーは必要になると話しています。

"Westworld"等で知られるシドニーに住むフィルムメーカーのPatrick Clair。いつも彼はコンセプトアートの情報源としてGetty Imagesを使っていたが、DALL-E 2を用いて生成した大理石像は自分が欲しかったイメージにGetty Imagesよりも近かったとのこと。AIはコンセプトアーティストを置き換えたり、ハリウッドの特殊効果の魔法使いを解雇したりするのではなく、全ての映画製作者のツールキットの一部になるだけと話しています。
「電卓が暗算ではできない方法で数字を処理することができるのと同じように、Photoshopは手ではできないことを行うことができます。しかし、Photoshopは決してあなたを驚かせることはありません。」「一方、DALL-Eは、真に創造的なもの持って帰って来てあなたを驚かせます。」

ニューヨークの広告代理店"Wunderman Thompson"のエグゼクティブであるJason Carmelは、クリエイティブなブレストにおいてAIが役に立つのではないかと話しています。そして、AIが全ての広告代理店のクリエイティブプロセスの一部になると予想しつつも、それによって代理店の作業が大幅にスピードアップしたり、アート部門を置き換えたりするとは考えていないとのこと。
AIが生成した画像の多くはクライアントに見せるには不十分な品質であり、正しいプロンプトを定めるには多くの時間を浪費する。あくまでもAIは、スケッチツールである、と。

ロンドンのサービスデザイナーであるSarah Drummondは、改善しようとしているカスタマープロセスを視覚的に表す「店舗のレジに並ぶ顧客たち」といったモノクロのスケッチにAIを使い始めているとのこと。"blob drawings"と呼ばれる手作業に何時間も費やす代わりに、DALL-E 2やMidjourneyを用いて彼女は画像を生成しています。ただ、AIは複雑なスケッチや同じキャラクターで複数枚の画像を作成するのが苦手である、と。
他のクリエイティブ・プロフェッショナルと同様に、AIが人間のイラストレーターを置き換えるとは彼女も考えていません。あくまでもAIはヴィジュアルデザイナー、建築家、都市プランナーといった、あらゆる種類のデザイナーがあるフェーズで行う描き捨てるようなスケッチ(ラフなスケッチ)のためのもの。つまり、AIはスケッチツールと彼女も言う。

このように欧米では"generative A.I."が多くの分野に侵入し始めている状況のようで、日本国内もこの流れになるのは必定と言えるでしょう。そして、いずれの話も「現時点でのAIの役割」を説明しているに過ぎないですね。クリエイティブワークの初期から中間までの生成物はAIで、最終成果物は人間が仕上げるという役割分担の割合も技術の進化でどんどんと変わっていくことが予想されます。既にAIで生成した画像がアートフェアで賞を受賞するに至っているので。2人の審査員はMidjourneyがAIであることを知らなかったとのことですが、もし知っていたとしても賞を授与したと話しているのは面白いですね。

先週の月曜日にサンフランシスコで行われた(オープンソースでStable Diffusionをリリースした)Stability AI社の1億100万ドルの資金調達を祝うパーティーには、Googleの共同創業者であるSergey BrinやAngelListのNaval Ravikant、エンジェル投資家のRon Conwayらが集まったとのこと。

英国出身のStability AIのファウンダーでCEOのEmad Mostaqueは、オックスフォード大学で数学とコンピューターサイエンスの修士課程を修了したあと、コンサルファームのアナリストやヘッジファンドマネージャー等の経験を経てStability AIの設立に至ります。ソフトウェアエンジニアとしては大学卒業後にMetaswitch Networks社で1年程度あるようですが、大部分はコンサルや投資家としてキャリアを積んできた人物のようです。

彼は一部の企業がAI技術を独占することに反対し、他とは異なり、オープンソースでStable Diffusionをリリースしたのが大きいですね。パーティーでもGoogleとFacebookのターゲット広告を"manipulative technology"として非難し(Sergey Brinがいるのにもかかわらず。)、Stability AIは「パノプティコン」を構築しないと述べたようです。

人々とコミュニティを信頼し、透明性に価値を置き、民主化を進めることである種のユートピアを実現しようとするその行為。
過去に何度か耳にしたフレーズのような気がしますが、AIの進化がクリエイティブワークを含めた産業全般に及ぼす影響というのは今後の気になるトピックの1つになるでしょうね。