メインコンテンツにスキップ

チャットGPTに「世界最古の写真」を修復させてみたところ、非常に残念な結果に

記事の本文にスキップ

12件のコメントを見る

(著) (編集)

公開:

現存する最古のカメラ写真「ル・グラの窓からの眺め」この画像を大きなサイズで見る
現存する最古のカメラ写真 public domain/wikimedia
Advertisement

 「ル・グラの窓からの眺め」は、1826年から1827年頃、フランスで撮影された現存する世界最古の写真と言われている。それゆえにぼんやりとしており、細部までよくわからない。

 そこでネットユーザーらは、この歴史的な写真を生成AI、チャットGPT(ChatGPT)を使って復元を試みた。

 ところが生成された画像は、まるで別物のような出来栄えで、なぜか現代的な風景にアレンジしてしまったのだ。

 これを見たほかのユーザーたちも、自分なりのプロンプトでこの写真の復元にチャレンジ。生成AIの限界に挑み始めたのだが…。まあその結果を見ていこうじゃないか。

「現存する世界最古の写真」の風景を生成AIで復元

 「ル・グラの窓からの眺め」は、ジョゼフ・ニセフォール・ニエプスが1826年から1827年に撮影した、現存する中では世界最古と言われる写真である。

 フランス・ブルゴーニュ地方サン=ルー=ド=ヴァレンヌ村にある自宅2階の窓から見た風景を、化学薬品を塗った錫(すず)の合金板を使い、8時間~数日間の露光時間をかけて撮影されたそうだ。

 これはヘリオグラフィーと呼ばれる当時の写真技術である。

この画像を大きなサイズで見る
Nicéphore Niépce, Public domain, via Wikimedia Commons

 原版はほとんど判別不可能な状態だが、1952年に再発見された後、専門家の手でコピープリントが作成された。

 とはいえ、ぼんやりとした明暗からなる、かろうじて建物の輪郭がわかるレベルである。

 redditユーザーのillegitimatenessは、この写真をChatGPTにアップロードし、画像生成機能を使って当時の風景を再現しようと試みた。

この画像を大きなサイズで見る
現存する最古のカメラ写真 「ル・グラの窓からの眺め」  public domain/wikimedia

 するとChatGPTは独自の解釈で変な変なアレンジをして、鮮やかな色彩の画像を生成した。

 そこには風変わりな屋根を持つ、「AIが考えた」窓からの風景が再現されていたのだ。

この画像を大きなサイズで見る
image credit: reddit

 この画像をillegitimatenessがredditのChatGPT板に投稿すると、興味を持った多くのユーザーが集まって来た。

  • まだAIは「そこ」まで到達してないってわかるだけでちょっと安心したわ
    • あと1年もすれば到達すると思うよ。そうなったら何が起きるか怖い?
      • いや、永久に到達しないと思うな。LLM(大規模言語モデル)って、100%正確に画像を再現できないし、そもそもそういうもんでもないし
  • むしろ立体をちゃんと理解できないのが問題かな。あの屋根の形とかヤバい。でもまあ、そのうち改善はするだろうね
  • 単純にミスってるだけなんだよね。例えば壁の構造とか、明らかに違ってるし。ちゃんとやるなら最初から作り直さないと
  • つまりAIは、「なんとなくそれっぽい形」でハルシネーション(幻覚)を起こしたって感じかな。これは彩色でも修復でもない。画像の大部分が完全に別物になってるし、屋根のラインも意味不明だし、ちゃんと写ってるはずの構造物がAIの画像にはないし。ディテールの詰めが甘すぎ
  • (元画像は)日差しが平らな地面に当たってるだけに見えるな。あの三角の暗い部分は自分には植物に見えるんだ。屋根の上じゃなくて地面だと思う。まあ、露出中のトラブルで暗い領域が現れたとしたら、屋根なのかもしれない。手動で補正する場合、ある程度推測する必要がある。この写真には詳細が少ないから、人によっては庭に見えるかもしれないし屋根に見えるかもしれない。個人的には平らな庭だったんじゃないかと思う。周囲の丘が見渡せるように、あえて平らにしてたんじゃない?
  • もっと確実にするには、現地のアーカイブを調べて当時の地図を見つけるしかないと思う。そこに小屋が描かれてれば判断できるだろうし。あるいは考古学的調査かな。でも小屋が痕跡を残してるかは怪しいけどね
  • ChatGPTが画像を再現する時って、アップロードした写真があるとi2i(画像→画像)で処理して、テキストだけの場合はt2i(テキスト→画像)を使うみたいだよ

生成AIで修復にチャレンジする人が続出

 そしてこの試みが面白そうだと思ったスレの住人たちは、次々と生成AIを使った「ル・グラの窓からの眺め」を投稿し始めた。

 さまざまな風景が「再現」される中、AIの解釈が分かれたのは、上のコメントにもある通り真ん中の三角形に見える部分である。

 この部分はこれまでも屋根なのか、それとも建物の影なのか、あるいは庭の一部なのか議論が続いていた。AIもこの部分の解釈には頭を悩ませたようである。

 多くの場合、AIは三角部分については、瓦の乗った屋根を生成してくることが多いようだ。だが中にはこんな、外壁の一部とする画像も。

 また、奥に見える尖った何かも、尖塔なのか樹木なのか、屋根の飾りなのか、画像によって解釈が分かれがちだ。

この画像を大きなサイズで見る
image credit: reddit

 遊び心のあるプロンプトを入れたのだろうか、こんなモノまで出現させてしまうパターンも。

この画像を大きなサイズで見る
image credit: reddit

 こちらは構図以外はまったくの別物になってしまった「作品」。ディストピア風味のある夜景に仕上がっていて、これはこれで悪くない。別物だけど。

この画像を大きなサイズで見る
image credit: reddit

 こんなカラフルでポップな画像も出て来たようだ。三角形の部分はスッパリ忘れられてしまっているが、意外と好評だったらしい。

この画像を大きなサイズで見る
image credit: reddit

 そんな中、かなり高評価だったのがこの画像。元の写真に構図や建物の形が一番近い点が評価されたようだ。

この画像を大きなサイズで見る
image credit: reddit
  • ウェブ検索機能と推論モデルを組み合わせれば、もうちょっとマシな結果が出ると思う。自分は歴史的データをチェックするように促してみた。レイアウトは少し良くなったけど、改善されたのはほとんど色と素材感だったね(生成した本人によるコメ)
  • 「ちゃんと使える人」こそが、AIを使って実際に何かを生み出せるんだって証明してる感じだよね
  • これいいね。他のは見ていられなかったけど、これは良くできてる!
  • でも正直、そんなに突飛なことはしてないよね? でもそれが大事なんだよ。ツールをちゃんと理解してる人ほど、単にプロンプトを投げっぱなしにするんじゃなくて、結果を改善できるんだよ
  • これはオリジナルより正確ってわけじゃないよね。ただ、昔の建物っぽく見えるってだけでさ。本質的には、原典より正確な再現なんてできるわけないじゃん
  • 正直なところ、これも他のと同じで、そんなに感心しないわ
  • 確かに見た目は良くなってるし、リアルっぽくも見える。でも、風景としてはやっぱズレてるよね。もっと現場の情報を与えたらどうなるか、ちょっと気になるな。画像生成モデルって、指示をうまく解釈してくれないこともあるし

生成AI以外にも行われていた再現の試み

 もちろんこれまでには画像生成AIの手を借りずに、この風景を再現しようという試みも何度も行われて来た。

 こちらはstarworldlabによる、現代のカメラで撮影した場合はこうなるだろうという「解釈」で作ったイメージだ。

この画像を大きなサイズで見る
image credit: Instagram @starworldlab

 また、下の画像は2021年8月の「世界写真デー」を記念して、ポルトガルの建築ビジュアライゼーションを扱う3Dデザイン会社が再現したもの。

 撮影時の太陽の位置や当時の建物の情報などを3Dモデルに落とし込み、レンダリングして作成したそうだ。

Facebookで開く

AIにとっても手強い「世界最古の写真」?

 最近は生成AIの力を借りて、昔の写真や映像を復元したり、修復したりといったことが盛んに行われるようになった。

 AIに頼めば解像度を劇的に上げ、傷を消し、ぼやけた写真や映像をシャープにし、白黒写真をカラーにするなんてことも簡単にできてしまう時代である。

 さらにAIは写真の中の人物を動かして、まるで生きているかのような動画に仕上げるなんてこともやってのけてしまう。無料で試せるアプリやWeb版もあるので、一度気軽に使ってみるのもいいと思うんだ。

 だが、そんなAIにとっても、この「ル・グラの窓からの眺め」はかなりてこずる相手らしい。ではこの世界最古の写真は、実際にどんな場所で撮影されたのだろうか。

 撮影者のニエプスは、フランスのブルゴーニュ地方サン・ルー・ド・ヴァレンヌにある、一家の「夏の邸宅」ル・グラの窓からこの写真を撮影したと言われている。

 下の写真の2階にある向かって右端の窓が、撮影場所だと言われている。ただし、後に煙突を増築した際、窓の位置は70cmほど移動していることがわかった。

この画像を大きなサイズで見る

 実際にここから撮影したとされる窓からの風景。今はもう、他の建物は何も残っておらず、再現する際のヒントとなるようなものはない。

 ル・グラはニエプスの死後何度か所有者が変わっており、敷地にあったであろう建物の詳細はよくわかっていないようだ。

この画像を大きなサイズで見る
image credit: reddit

 この邸宅は現在、ニエプスが暮らしていた当時の状態に復元され、「Maison Nicéphore Niépce」という博物館として一般に公開されている。

 ブルゴーニュのワインと美味しい料理が楽しめるガストロノミーや、プール付きのB&B (ベッド・アンド・ブレックブレックファスト)も併設されており、写真の歴史に思いを馳せながら、フランスの田園を満喫できそうだ。

 なお、「ル・グラの窓からの眺め」が、実際にどんな風に撮影されたのかについては、下の動画でわかりやすく説明されている。字幕の翻訳機能で十分伝わると思うので、興味のある人は見てみてほしい。

Les points de vue ou l’invention de la photographie

References: Redditors challenge ChatGPT to restore world's oldest photograph… to baffling effect / I asked ChatGPT to restore and colorize the world's first image

📌 広告の下にスタッフ厳選「あわせて読みたい」を掲載中

この記事へのコメント 12件

コメントを書く

  1. 昔の人がくれた絶対に解けないクイズだな
    どれも正解だと思うぜ

    • +11
    1. 少なくともスターデストロイヤーは外れだろw
      自分的にはそれが正解であって欲しいとは思うが

      • +15
      1. それにしてもインペリアル級ではなくインターディクター級なのは何故なんだ

        • +4
  2. 最初オリジナル見たときは製図台みたいな角度がついた机に肘をついて頭を抱えてる人の写真かと思った

    • +19
  3. 先入観無しに見ると一般的な三角屋根の平屋があるようにしか見えない

    • +4
  4. パレイドリア発生して、おじさんが斜めの机の前で作業しているのを窓から見てる図だと思った

    • +8
  5. 塔みたいな物とその下のシミっぽい部分は現像ムラ的な後からついた物な気がする。
    粒子の出方とエッジが他と違う。

    • +3
  6. 実際の現場や当時の建築を知らなければ、正確に復元するのは無理どころか、ほぼ勘に頼って適当にでっち上げるしか無いよね。

    AIに何を期待してるんだ?と。逆に、当時の現地の風景や建築、実際の建物などを学習すれば、相応の結果を出してくると思うけどね。

    ただ、この話は、「最終チェックは必ず人間が行う必要があり、チェックする人間にはAIの出力の正否を判断する正確な知識と分析能力が求められる」ということを明確に示してる良い例だと思う。

    • +10
  7. GPTが生成した画像、非常に残念ってレベルでもないと思うけどな

    • +4
  8. 撮影された時期、場所、当時の建物の構造や建築様式を
    正確に伝えなかったらどんな優秀なAIだってこんな不鮮明
    な写真だけで細部まで正確に復元できるわけがない。
    AIは魔法使いじゃないんだよ。

    • 評価
  9. 学習した内容に基づくから、当該地域の当時の風景を大量に学習できないなら、こうなるのはあたりまえさねw
    というか、ボチボチ生成AIでできること、できないことが明らかになってきて、ようやく地に足がついた感じ
    インスピレーションを得たり、補助としては役に立つけど、信頼できる最終的なアウトプットにはならない
    むしろAIが生成したコンテンツをAIが学習したりして、もうデマがデマを呼ぶ状況、投資家は資金回収を急いでる

    • -1

コメントを書く

0/400文字

書き込む前にコメントポリシーをご一読ください。

リニューアルについてのご意見はこちらのページで募集中!

サイエンス&テクノロジー

サイエンス&テクノロジーについての記事をすべて見る

  1. 記事一覧を読込中です。

歴史・文化

歴史・文化についての記事をすべて見る

  1. 記事一覧を読込中です。

最新記事

最新記事をすべて見る

  1. 記事一覧を読込中です。