この画像を大きなサイズで見る低解像度の画像はぼやけていて、どんなに目を細めてみたところで、くっきり鮮明に見えることはない。
だが、Googleが開発した画像合成AI技術を使うと、低解像度の画像をごく自然な高解像度画像に変換することができる。
その出来栄えはあまりにも自然すぎて、処理された画像がオリジナルで、もともとの画像の方がモザイクでぼかされたものに思えてくるほどだ。
この技術を応用すれば、不鮮明な古い写真を綺麗に仕上げたり、医療用の画像装置を改善したりと、さまざまな分野で役立つことが期待されている。
あえてノイズを追加することで高解像度画像を生成
これまで画像合成処理を行うAIとして一般的だったのは、「敵対的生成ネットワーク(GAN)」「変分オートエンコーダ(VAE)」「自己回帰モデル」といった深層生成モデルだった。
しかしGoogle AIが投稿したブログ(21年7月16日付)によると、今回の技術には「SR3(Super-Resolution via Repeated Refinement)」といった「拡散モデル(diffusion model)」が採用されている。
このモデルは、入力された画像データにあえてノイズを加えていく。どんどんノイズを加えて画像を破壊する。そしてAIはその過程を学習する。
画像をただのノイズにまで壊してしまったら、学習したニューラルネットワークにもとづき今度はそのプロセスを逆転する。すると、もともとの画像よりもずっと鮮明な画像が生成されるのだ。
この画像を大きなサイズで見る人間が判別するのが難しいほど自然
Google AIは、人間の被験者にオリジナルの画像と修正された画像を見てもらい、どちらがオリジナルか当ててもらうという実験も行なっている。
結果は、生身の人間ですらなかなか判別できなかった。
従来の画像処理AIを使った場合、区別に失敗するケースは3割程度でしかなかったが、最新モデルでは、50%近くの人が判別できなかったのだ。
この画像を大きなサイズで見る
この画像を大きなサイズで見るSR3による連続処理で高解像度画像を生成
もう1つ紹介されているのは、「Cascaded Diffusion Models(CDM)」」という技術だ。これはSR3などの分散モデルを連続的に行うことで、低解像度画像を高解像度にアップスケールすることができる。
32 x 32ピクセルの画像を256 x 256ピクセルに変換しても、わんちゃんやチーズバーガーはごく自然な写りだし、64 x 64ピクセルの人物を1024 x 1024ピクセルにしてもなんの違和感も感じない。
この画像を大きなサイズで見る
この画像を大きなサイズで見る
この画像を大きなサイズで見る
この画像を大きなサイズで見るこの最先端AI画像加工技術に対し、Facebook上では
・こいつを日本の某映像に試してみるよ。
・修正画像と同じ解像度の元の写真があればもっと面白いだろうね。修正画像は確かに自然だけど、オリジナルとはどのくらい違うんだろう?
・昔の映画がネタにされることがあるけれど、今では一気に綺麗にする魔法のボタンがあるわけね。
・この技術からはどんな狡猾な悪用法が生まれるんだい?
・つまり映像内の隠された顔は全部丸見えってこと? いい話とは思えないな。
などの声が上がっていた。さて、みんなならこのAIでどんな画像を高解像度にしてみたいだろうか?
モザイクを全て取り外すことができる上に高解像度になる魔法の技術だと大喜びしている人は世界中に存在しそうだけども、そこはパンドラの箱なのかもしれないし、そうでもないのかもしれない。














ファミコン時代のドット絵に適用してみたいね
どういう結果になるのか興味津々
> 日本の某映像
わろた
昔の雑誌の広告でおなじみのアレがついに・・・
民衆「ケネディ暗殺の映像をリマスターしようぜ」
??「ダメです」
顔にモザイク掛かった画像はアレに変換されそう
この手の技術は「あってもおかしくない画像」「自然に見えるくくらいもっともらしい画像」をAIが提案してくるものであって、真実を復元しているわけではないんだよね。
だから歴史資料とか科学的な目的に使うには危険。
娯楽目的とかには非常に有効だと思うけどね。
※6
そんなの誰でもわかってると思うけど
※16
「医療用の画像装置を改善したりと、さまざまな分野で役立つことが期待されている。」
誰でもわかっているようには見えないが?
※6
似たような、AIによる粗画質のクリア化システムで
「元の写真」「わざとモザイク状態にした写真」「復元写真」
を並べてあるのを見たことあるけど、
いくつか失敗してるポイントがあった。
・縁なし眼鏡でツルもゴールドっぽい色だと、復元写真では眼鏡消失
・薄い眉毛が消えたり、逆に眼窩の影でモナリザに眉毛が生成
・前髪が眉毛にかかった影で、復元写真はゴン太ゲジゲジ眉毛に
・八重歯はスッキリ矯正、ぷっくりタラコ唇も薄く整形
・アオリの角度で目を細めて、黒い円弧しか見えない人の写真が
涙袋のあたりに無理やり白目を作って 変な三白眼の表情に
>>6
たとえばほくろのある人が低解像度でホクロが見えなくなってたとして、これで高解像度にしてもホクロは復活しないよね
本文にあるような医療に使えるとは思えない
※6
解像度の低い証拠画像がモニタに映し出される
映像データ担当の女性が「処理します」とか言う
鮮明な画像が現れる
一同「ざわっ」
沢口靖子の顔が大写しになり、音楽が変わる
・・・おいおいおい、そんなんでエエんかいな、と
すばらしい技術だ! 昔の写真も鮮明になるね。これでピンボケ写真もなくなるかもね。
それ以外の用途は思いつかないね!
生成技術ね。
不鮮明な監視カメラ映像に使えれば。
日本の某映像をクリアにできたらきっとそれは素敵なことやん?
マイクラの画面つっこんだらどうなるんだろ
縮小→拡大を何度か繰り返すと全くの別人になって面白そうだからサービスが始まったら試してみたい
動画はまだなんだな?残念
※18
動画は画像の集まり。簡単に応用できる
あくまでもAIの仕事なので、人間の仕事ならあり得ない方向に歪んでいるね。
眼鏡の男性も片方が皮膚と同化してしまっている。
人間ならそれが眼鏡だと認識できるので、左右対称に再現する筈だけど。
デジタル技術の驚異ってやつですね……
>従来の画像処理AIを使った場合、区別に失敗するケースは3割程度でしかなかったが、最新モデルでは、50%近くの人が判別できなかったのだ。
冷静に読むと、過半数のケースではオリジナルよりも悪化した。もしくは効果がなかったということなので、過大な期待は禁物
※21
それちゃうんやないの?
オリジナルの画像と、それにノイズを加えてからAIに復元させた画像を人間に判別させたら正解率は約50%だった、つまりランダムで選んだ時と変わらないってことは人間にも判別は難しいくらいに復元できてるってことやないかな?
ガラケー時代に撮った写真も鮮明になるのかな?
うちの猫が子猫だった頃の写真が鮮明になったら嬉しい
いずれ防犯カメラとかに役立てばと思ったけど、コメントを見るとそういった方面には使えないのかな
流出を待つのみから正面突破する時代がきたか
年齢制限つけないと
ネット上に答えがある画像のみ対応だよね。
例えば、宇宙の果ての画像とかには使えない。
ぼかされたカード番号とかだと、
鮮明に事なる番号が復元されるんだろうね。
電車のレールがおかしいのも、AIがレールの形を覚えればちゃんと描ける。みたいな感じなんだろうか
監視カメラ映像のAIによる高解像度化で全くの他人が逮捕される未来もこれからあるんだろうか
平たい顔族の結果も見ないと信じない
これはなんか世界中でプライバシーとかがぶっ壊れそうな嫌な予感がするな・・・
やっと詐欺でないモザイク消しが出来たわけか。
早くっ、早く開発するんだ!
納車式
やっと野獣先輩のイキスギ顔を鮮明にできる…
ファミコン時代のドット画がどうなるか試してみたい
この技術が普及すれば、ピントのずれた
コメントも修正されて、世の中はもっと
優しくなるだろうな。
自分の顔にモザイクかけてからAIに復元させたい。