メインコンテンツにスキップ

注文どおりの仕上がり・・・なのか?AI(人工知能)に言葉で指示して画像を生成してもらったところシュールすぎる結果に

記事の本文にスキップ

89件のコメントを見る

(著) (編集)

公開:

この画像を大きなサイズで見る
image credit:Ai weirdness
Advertisement

 最近、ある研究チームが、記述された内容に基づいて画像を生成する機械学習アルゴリズムに関する論文を公開した。

 「AttanGAN」と呼ばれるGAN(敵対的生成ネットワーク / 教師なし機械学習で使用される人工知能アルゴリズムの一種)で、言葉や文章で指示すればそのとおりの画像を生成してくれるというものだ。

 鳥の画像を生成するよう訓練したところ上手くいったらしいが、しかしこの世には鳥以外にも多種多様なものが存在する。

 それらのデータをすべて学習させるのはとても大変で、だから結果として個性的な画像が続々と誕生してしまうことになってしまうようだ。

「AttanGAN」を体験できるおもしろサイトが誕生

 アメリカ・ニューヨーク大学の研究者、クリス・ヴァレンズエラさんは、この「AttanGAN」を使ったユニークなサイトを立ち上げた。

 好きな言葉を入力すればそれに基づいてAIが画像を生成してくれてとっても便利なはずなんだけど・・・?

 それでは、どんな風に仕上がるのか見てみることにしよう。

1. 注文内容:いたって普通の人間の身体

この画像を大きなサイズで見る
image credit:Ai weirdness

2. 注文内容:ネクタイをしめた男性

この画像を大きなサイズで見る
image credit:Ai weirdness

3. 注文内容:大きな一片のピザを食べている少女

この画像を大きなサイズで見る
image credit:Ai weirdness

4. 注文内容:ヒツジたちが私の寝室のベッドの上でジャンプしているところ

この画像を大きなサイズで見る
image credit:Ai weirdness

5. 注文内容:一般的な「止まれ」の標識のところで止まっている車

この画像を大きなサイズで見る
image credit:Ai weirdness

6. 注文内容:一匹のヒツジ

この画像を大きなサイズで見る
image credit:Ai weirdness

7. 注文内容:お茶会を開催中のゾウたち

この画像を大きなサイズで見る
image credit:Ai weirdness

8. 注文内容:ただ一つの時計

この画像を大きなサイズで見る
image credit:Ai weirdness

9. 注文内容:食料品店でピザを買う馬たち

この画像を大きなサイズで見る
image credit:Ai weirdness

 求められているものを書かなきゃ!とAI的にも頑張っているが、とにかく訓練すべきことがあまりにも広範囲なためなかなか追いつかないようだ。

 そう指示したわけではないのにリアルな写真と抽象的な絵画がコラージュされているみたいなのもあってなんだか不気味だけど芸術的といえばそうかもしれない。

 試してみたい人はこちらから!

References:Cvalenzuelab / T2i / Ai weirdness / Github など / written by usagi / edited by parumo

📌 広告の下にスタッフ厳選「あわせて読みたい」を掲載中

この記事へのコメント 89件

コメントを書く

  1. AIに絵や写真を見せて覚えさせるだけでは足りないというかAIには体がないのだし重力が身体に及ぼす作用とかも良く判らないだろうしAIが人型ロボットを設計して模索するところから始めないと…と言う気がする。

    • -1
    1. ※2
      ニューラルネットワークは入力と出力の相関関係を学習する仕組み。
      この場合、それぞれの単語や単語の順番、文法という入力に対して最も「自然な画像」は何かを学習してる。

      基本的には適切なネットワークの設定と十分な量の学習データと十分な計算資源があれば「自然な画像」が生成できる。
      少しでも仕組みを知ってればそんな発想にはならないはずだけど・・・

      • +1
  2. なぜ途中から不思議の国のような題材にした

    • +19
  3. AI至上主義でAIが言う事は確実に起きる!
    みたいな風潮だけど……実際は対したことなさそうだな

    • +8
  4. リラックス中のショゴスって注文したらちゃんと作ってくれそうな気がする

    • +15
  5. 知能とか知性と呼ばれるものって一体何なんだろうと思わせるね最近のAIは
    人間のそれとは異質の知性

    • +8
  6. 指示を出してる人がピザが好きってことはわかった

    • +13
  7. サルバドール・ダリ「なかなか上手いじゃねえか」
    アンドレ・ブルトン「いい線いってる」
    マックス・エルンスト「もっとはっちゃけてもええで」

    • +28
    1. ※8
      寧ろ一流の芸術家はそんな上から目線じゃなくてここから何かを学ぼうとするだろう

      • +3
  8. 何をどう処理してるのかわからんとなんとも。
    つまるところ、なぜそうなる?

    • +8
  9. >食料品店でピザを買う馬たち

    これ普通の人間でも描くの難しいお題のような・・・。

    • +12
  10. 面白いね。何千、何万回と繰り返していく内にどんどん正確に描けるようになるのかな?

    • +7
  11. おもしろいね こういうの好き
    「大地に降り注ぐ雨」と翻訳してやったらわりと良い感じの絵が出来た
    自然の景色関係はわりといいかも

    • +5
  12. 自分で1から作成するんじゃなくてネット状にあるもんを持ってきて繋ぎ会わすからいまのAIはまだ悪質なコピペ師

    • +4
  13. で、接頭語付けるのはいいんだけど
    接頭語付けてないバージョンとの対比が無いから
    いまいち面白みに欠けるんだが…?

    • 評価
  14. まずは既存のお題通りのポーズや情景の画像を
    コラージュさせてマネぶ事=学ぶ事をさせないと
    今は知ったかぶりの知識で理解も再現も出来ないのに
    出来るふりをしちゃってる恥ずかしい状態。

    • 評価
  15. どうやら人間が求めている対象物と空間のあり方を表現するのが苦手みたいですね。

    • 評価
  16. 試しに
    ”Beautiful angel”
    って入力したんだ
    ・・・うわあああああ!

    • 評価
  17. ダリか?とコメントしようと思ったらすでに書かれてた。

    • 評価
  18. 与えるデータが悪いからこうなっただけ
    特徴のデータだけを適切に与えればまともな絵は描ける
    逆に言えば、与えるデータに左右されるってことは人工知能ではない
    画像生成なんて人工知能にはいらない
    ただの条件付きプログラムの一種

    あまりにも人工知能を拡大解釈しすぎ
    画像生成なんて類推できる知能ではなく、データの分類に過ぎない

    • 評価
    1. ※31
      ※41
      なんになるの?と書いてる人がいるが
      記事を読んだ感じではおそらくここからさらに正確で効率の良く学習させるにはどうしたら良いかなどを研究するためのデータ収集だと思うよ
      だから今はうまく描けなくて当然だと思う
      だが我々はこのうまく描けなさを愉しめばいいと思う

      • +3
  19. red mountainと具体的に指示をしても赤い妙なものが描き出された
    こういう感性が欲しいなとちょっと思った

    • 評価
  20. 逆に今の時点の技術で言われたもの全てをきちんと描けたらビックリする。

    ちなみにこの技術は、これこれはこういうものという手本は与えれれるが(人間もその点は同じ)、それ以降は自分自身(2つのニューラルネットワーク)で切磋琢磨して学習して上達していき、描く時はネットの画像を持てきている訳ではなく自力で描き出している。そして嵌れば写真と見紛うオリジナルの画像を描き出せる。

    このAIはまだ世界のあらゆるものの知識が殆ど入ってないから(もしくはまだ殆どのものについて切磋琢磨が完了してないから)対応出来てないものが多いんだろう。
    まだ時間やコンピュータパワーが必要。
    しかしAI用ハードは既存のCPU以上に発展スピードが速いから3年も経てばかなり改善しているはず。

    • 評価
  21. 今はネタにできるレベルでしかないけどどんな指示でも人が求める完成度で描けるようになる時が少し怖いな、人とそう変わらぬ思考回路を手に入れる日が。

    • 評価
  22. さっきちょっと使って見たけど
    指示が付加されるごとに生成される画像が変わるのね
    ちょっとだけの時もあるし、大幅改変ってのもあった。
    こちらは英語出来ない人なんで、文法の怪しい指示によく応えてくれたなぁ、と。

    画像生成AIさんが提示して来る生成物見てると
    取り敢えずウチらとオマエのゲシュタルト違いを
    どうにか擦り合わせられ無いの?と思う反面
    そもそも全く異質な進化がどこまで行くんだろうかなぁ、と。
    このまま突き進んだ結果が楽しみでもあるね。

    • +5
  23. でさあ、これをやってなんになるの?
    研究者が新しいおもちゃで遊んでるだけじゃん
    自分の研究が自分で面白いと思えばそれでいいとかやっぱ研究者の大半はただの道楽者でしかないわ

    • -16
    1. ※41
      研究なんて、何が役に立つかわからない。何かが確実に役に立つ、とわかっているならそれはすでに知られている内容であって、そもそも研究は終わっている状態。だから、研究者は一見役に立たないもの、役に立つかわからないものを積極的に研究していくしかないわけです。

      • +6
  24. AIが人間の「(土の前で)おーいアレ持ってきて」「はい(スコップ差し出し)」という阿吽の呼吸を習得なり会得するのはまだまだ先のようだな。

    • +3
  25. 試しにいろいろやってみたら、
    「 a high mountain 」
    「 a table and chairs 」
    「 a ship on the sea 」
    「 beach and blue sky 」
    「 men walking in the snow field 」
    「 a bookshelf in the room 」
    「 an evening shop 」
    あたりは、なんとなく それっぽくなった。

    • +1
  26. 風景に移る物体を個体として認知って生物が少なくとも10億年かけてなんとか獲得した機能な訳で…
    機械的学習じゃそう簡単に獲得なんかできないんだろう
    ある程度人間のプログラム調整が必要なのは当然だろうね

    • 評価
  27. 色々試したけど、抽象画みたいな画像しか出てこないw

    • +1
  28. 突き詰めれば「正確な目の数とは?」「パーフェクトな体とは?」という問題にも突き当たりそう

    • 評価
  29. 「 a zebra 」と入力しても何だかよく判らない塊なのに
    「 a zebra and 」とすると何故かシマウマ度が増す

    • +3
  30. ワクワクして開いたのに、怖い写真かと思った(;ω;)

    • +2
  31. これ簡単な単語ですら再現できてないみたいだけど、AIの考えてるイメージと俺たちのイメージってもうすでに誤差がでてるのか?特異点が始まった?

    • +1
  32. そもそも単語が示す物を認識できてるのか?

    • +4
  33. オブジェクトごとに認識してないのかな
    背景も物体も渾然一体となっているものが多い
    人間と違って2Dの画像からしか学習できないからだろうか?

    • 評価
  34. ちょっと試してみたけど公開していレベルじゃなかったorz
    むしろまともにかける単語があるのか聞きたい

    • 評価
  35. 辛うじて羊はそれっぽく仕上がってる
    他は…うん…

    • 評価
  36. 画像生成のAIより自然言語処理のAIの方に問題がありそう
    指定された概念を画像に結び付ける事に失敗てるんじゃないかな
    もし指定方法を画像(ラフな線画の落書き等)にすれば
    高い精度で指定通りの綺麗な画像を生成してくれるだろう
    畳み込みニューラルネットワークは画像処理には極めて有効だけど
    自然言語処理にはそれほど向いていないと思う

    • 評価
  37. 機会学習ではデータ量がモノをいうから、今のところまともに稼働するのはGoogleやAmazonといった大量にデータ持ってるところだけ使える

    • 評価
  38. これはこれで嫌いじゃないw

    へたに上手くなったら凡庸なつまらない絵になりそうだし

    • +4
  39. 「Something I just imagining」って入れたら
    なんか起きる気がしたメルヘンな俺。
    (何も起きませんでした

    • +3
  40. 発達したAI「闇夜のカラスにござい~~ 」

    • 評価
  41. もしかしてAIってホントはものすごくアホなんじゃない?

    • +1
  42. Aiのこの手の絵が、糖質、認知症、薬中の描くそれに類似するのが興味深い

    • 評価
  43. AIは人を寄生獣のミギーのような姿で認識するってことは他の動物から見ると人間はこう見えているのかもしれない

    • +1
  44. 我々は意識が補正した世界を見なれてるから妙に見えるだけで
    無修正な世界はこのAIが見た世界に近いのかもしれない

    • +5
  45. むしろ現段階で機械学習のみで言葉から
    ここまでの絵を吐き出してくる事を驚異に思います。
    こういう事自体数年前には不可能だったわけで。

    • +4
  46. これインチキ臭いかも?適当なアルファベットを半角スペース織り交ぜつつ脇見しながらメチャメチャに乱打しても画像が出てくる。文字入力にスイッチ的に反応して画像出すだけの単純なプログラムじゃないかな?人間は意味不明な模様でも何かに当て嵌めようとするっていうし自分がタイトルつけたらなおさら騙され易くなりそう。

    • -2
  47. お絵描きでAIと遊んでるみたいで楽しい。

    • 評価
  48. これ、イラストの構図のアイディアに使えそう。描き込めばそのまま絵画になりそうなのが結構出てくる。

    • 評価
  49. cat とか appleですらまともに描けないんだよな

    • +1
    1. ※72
      基本的に学習に使ったデータのコラージュやで
      単語一つだけなら、普通に出てくると思う

      • -1
    2. ※72
      ただ、「 a dog 」と入力すると
      緑色の絨毯?芝生?っぽい物の上にある
      茶色っぽい長毛めのモフモフ塊、
      「 a cat 」と入力すると
      窓ガラス際?かどっかにでも居そうな背景の
      灰茶と黒の縞模様っぽい細身な毛の塊が出てくるから
      (なぜか入力する度に少しずつ違った物が出る)、
      一応「あー…、言わんとする雰囲気は分からなくもない」
      って感じではある。

      けど、幼児に絵を描かせる時の
      「何だかよく分からないけど、体と尻尾と4本の足があり
      顔に目や口や耳がある」ってのとは
      また全く違った認知システムなんだろうな。

      • 評価
  50. This is an apple. って命じてみたら、ちゃんとコンピュータらしきものを描いてくれたよ。
    「なるほど」と思ったね。

    • +1
  51. いまは訳がわからない段階だけど、どんどん精度が上がっていくんだろうね

    • +2
  52. 動いてくれない…
    白いまま

    英語が下手だからかな?と思ってみんなが書き込んでる言葉をコピペして見たけど動かん

    もしかしてこれ、スタートボタンがある?

    • +1
  53. いたって普通の人間(普通の人とは言ってない)

    • 評価
  54. とりあえずこのAIが羊のことを絨毯か何かとしか思っていないことはわかった

    • 評価
  55. 何ヶ月か前に同じくカラパイアで見た
    「AIに裸婦画を描かせてみた」って感じの記事と
    出来上がりのタイプが似ている気がする。

    人体の構造や顔の構成の根本については
    インプットされておらず、
    色と形状パターンの塊として配置している感じが。

    • 評価
  56. 一匹の羊
    が無理ならむしろ何なら用意出来るだお前は

    • 評価
  57. 試しにterrorって打ち込んでみたんだ…
    怖えよ…

    • 評価
  58. through the looking glass って入力したら
    きれいでした~

    • 評価
  59. なんとな雰囲気でわかるような気がする。

    • 評価

コメントを書く

0/400文字

書き込む前にコメントポリシーをご一読ください。

リニューアルについてのご意見はこちらのページで募集中!

サイエンス&テクノロジー

サイエンス&テクノロジーについての記事をすべて見る

  1. 記事一覧を読込中です。

画像

画像についての記事をすべて見る

  1. 記事一覧を読込中です。

最新記事

最新記事をすべて見る

  1. 記事一覧を読込中です。