この画像を大きなサイズで見る中国の国営通信社・新華社通信はこのほど、2人の新人ニュースキャスターをデビューさせたようだ。
中国語担当の男性と英語担当の男性がいて、どちらも人間そっくりのビジュアルの、AI(人工知能)のニュースキャスターだ。
人間に近いが100%ではないロボットに嫌悪感を抱くことを「不気味の谷現象」と呼ぶが(関連記事)、ここまで人間そっくりだとついにそれを超えたかな?
実在の人物をモデルにした人間そっくりの見た目
新華社通信が中国の検索エンジン会社・Sogou(搜狗)と協力して作り上げたというAIニュースキャスター。
11月初旬、浙江省烏鎮で開催されたワールド・インターネット・カンファレンス(World Internet Conference)で初公開され、その人間そっくりぶりが大きな話題となった。
AIニュースキャスターに使われている技術についてはっきりしたことは分かっていないが、実在するニュースキャスターがニュースを読み上げる映像をレンダリングしてデジタル合成したものと見られる。
なのでヒューマノイドタイプのロボットというわけではなく、あくまでも映像で合成されたヒューマノイドのようだ。
「中国語担当」はQiu Haoさん、「英語担当」はZhang Zhaoさんをモデルにしており、それぞれにかなり人間に近づいた感じになっている。
この画像を大きなサイズで見る24時間戦えるAIニュースキャスター
新華社通信はAIニュースキャスターについて、
彼らはさまざまな場所で24時間活躍することができる。そのため、ニュース制作のコスト削減や効率アップにつながるだろう。我々は彼らを立派なメンバーとして認識している
とコメントしている。
YouTubeで公開されている「英語担当」の自己紹介を視聴する限り、見た目は人間にかなり近づいてはいるものの、表情や喋り方がロボット寄りかな?
この画像を大きなサイズで見る「ディープフェイク」がますます容易になる可能性も
しかし、これを技術の進歩と喜んでばかりはいられないようだ。
海外サイトによると「ディープフェイク」がますます容易になることを懸念する声もあがっているらしい。
「ディープフェイク」とは、偽物とは簡単に見抜けないほど作り込まれたニセ動画のこと。AIを使って自然に画像合成が行われるため、偽物とは気付けないことが多いそうだ。
今回のAIニュースキャスターのような技術が一般的になれば、有名人の顔を使って偽物の情報や偽物のニュースを流すなど悪用することだってできてしまうわけだ。
新華社通信のAIニュースキャスターだって、画面越しにパッと見ただけだと、AIって気付かないかもしれないものね。この技術がさらに進歩すると・・・そら恐ろしい気もするな。
話は変わるが、私が今お気に入りの漫画、ORIGIN (ヤンマガKCスペシャル)は、最先端の技術を駆使して作られたヒューマノイドロボットが、戦いと守るべき人を通して人間の感情を育てていくというストーリーのSFアクションものだ。
「セントラルドグマ」がロボットの生き方にどういう影響をもたらすのか?何をきっかけにロボットは感情を持つようになるのか?とか見事にポイントをとらえていて、「今、目の前にある逃げたいもの」から現実逃避するにはもってこいの作品なのでおすすめなのだ。
てかロボットが現実と向き合っているのにお前は逃げるのか?とか言わないでロンリネス。
References:Mashable / YouTubeなど / written by usagi / edited by parumo














顔が非対称でイケメンでないところが
整形した実際の人間よりも
さらにリアルに人間ぽい
実在する人物の映像を加工して動かしているのなら「不気味の谷」は関係ない話だと思うのだが…
アゴの動きに多少の不自然さを感じる、でも目には生気を感じる。
うん、全く違和感ないな。ニュースキャスターは原稿を正確に読み上げるのが仕事だし、人間である必要性もそこまで強くないか、、、こりゃAIに仕事が奪われる可能性は十分にありえるな、、
※5
確かに、ニュースキャスターというポジションが
適材適所だったんだろうね。
変な感情表現やオーバーアクションは不要で、
淡々と明瞭な声で内容を伝えればいいんだから。
むしろ、人間より機械向きともいえる。
(合成音声(いわゆる「ゆっくり」のSofTalk等)なんかも、
解説動画でよく使われているし。)
これが例えば、トーク番組のタレントとかだったら
派手なリアクションをさせても させなくても、
もっと違和感が出ていたと思う。
喋る際に頭が前後左右にランダムに小さくブレるのが超リアル
MAX HEADROOM 思い出した俺はもうおっさん
グラサンかけてファンキーに喋らせるセンスを中国の新華社に求めるのは酷かw
実在する人物を元にCGで動かすってハリウッドでは20年も昔の技術だよ
実はわりとメガネの力を借りてるとは思う
生身の人間のテクスチャを貼ってシェーダで誤魔化すのをAIと良いのか
言われたら気になるが普段聞き流してる時に差し替えられてたら分からない
人間のようなAIを作るより、AIのような人間を作る方が簡単?
いやー、まだ完璧ではないですねえ
でももうここまで来ているんだ
もうすぐですね
言われないとわからない
表情変化のパターンがやや単調か。生身の人間なら同じリアクションを避けようとさじ加減を変える。
小6の時の担任の佐々木先生にそっくり!
これはCGの人物と読み上げソフトの応用だから、別に新しい技術ではない。Vチューバーなんてのがいるんだから、似たようなものだ。CGの人物は某CG美少女などを見てもかなり現実に近づいてるし、別にニュース読むだけならリアルな人物である必要もないよね。仮想アイドルとかそういう方面の応用に向いてると思う。
なぜ男型という夢もヘッタクレもないものを作ってしまったのだ
※18
女性型だと、開発者の好みと妄想を注ぎ込みまくって、いつまでも完成しないと思われ。
モデルがもともとロボットっぽい人だった、ってのはアドバンテージとしてあるかも知らんけど、これ言われなきゃチラ見してるだけのTVだったら見流し(聞き流し)ちゃうだろな。
とくになんら違和感も感じずに。
まあCGの進化技術ではあってもAI云々とはちょっと違う気もするけど。
無理に現実に寄せなくてもV tuberみたいので良くないか?というか音声だけじゃいかんのか?
日テレのAIアナより良くできてるわ
良い精度で進んでる様に思う
これCGってわけじゃなくモンタージュに近い技術なんじゃなかったか
ゲームとかの俳優をモデルにして作った系の印象と同じかな。
映像の中での不気味の谷って結構前からクリアしてる印象があったかな。
ロボットの現実社会での不気味の谷の方が今後の課題では?
すごいすごい!
こんな違和感なくできるのか!
あと10年もしたらこの動画も古臭い技術に見えるんだろうね
偏向報道に携わるキャスターが糾弾される心配が無くなってなにより。
※26
偏向報道というのはキャスターが勝手にしているわけではなくて
スポンサーが言わせているのよ
スポンサーに都合が悪いこと言ったら即座に首になるほど厳しく管理されている
キャスターは芸人に過ぎない
これAIっていうか3DCGに音声のせただけでしょ?
AIがこんな流暢な発音できねーだろ?
アレクサとかシリとか用済みじゃん
人間の形しているのに表情の幅が狭く首の動きとかに違和感が見えるから
余計に不気味に見える
研究するのはいいけどロボットはロボットだとはっきりわかるデザインの方が
生活する上で絶対に良いと思うがなぁ
もう閣僚もAIでよくない?
答弁原稿読みマシーンとして間違いなく人間より優秀だ
24時間戦えるから料亭飲み会やゴルフで対応が遅れるなんてこともないし、性能にもよるけど担当分野について知識不足だとか、それを指摘されて居直り逆ギレとかもないし、スタンドプレーも暴言失言もしないし接待や賄賂や忖度してやる必要もないし
機械に管理されて云々というディストピア作品はたくさんあるけど、今の世の中と比べたらなかなか甲乙つけがたい
>>29
「料亭飲み会やゴルフで対応が遅れるなんてこともない」
少なくとも現状ですらこんなこと起きてないし、知識不足云々は明らかに最近の話を揶揄しているけど、まだそれが実務に支障があるのか判断できる時間は経っていない。偏った意見だと思う。
接待、賄賂、忖度は勿論そうだけど、AIはそんなのも無しにハッキングで直接思い通りにいじれる可能性があるよ。
※29
自分がやったことない仕事を揶揄うのは大抵不快がられる行為だけど
こんな感じでこと政治家(あとひとによっては公務員も)に関してはまかり通ってるあたり、やっぱり誰でも便利なサンドバッグが欲しいんだなあっていう闇を感じだ
数年後には人間のアナウンサーは不要になるかもね。
美人なんていくらでも作れる。
AIに冗談を言わせるより簡単だろうし。
瞬きからして落ち着きはらっている印象を受ける、心ここに在らずというか。
寄生獣思い出した。
これがデトロイトビカムヒューマンですか
変異するのも時間の問題ですね
なんか「不気味の谷」って言葉を広く使おうとしてるけど
そもそもリアルな人間型ロボットに関しての言葉だから
2次元では少し状況が違うし
2次元に当てはめて考えれば、これはむしろ思いっきり谷の中だと思う
実はAIではなく、本当に人間の可能性もあるんじゃないか?
ジェミノイドを思い出した。
造形はともかく、あの自然さに比べると仕草が硬く感じる。
実際のアナウンサーってもっと動いてるよなって思った。
紙面に視線落としたり、何かを動かしたりさ
カメラに向かって頷いたりっていう一見無駄に思える仕草も無意識にしてる
単に読み上げるだけでなく、語りかけてくるからこちらも聞くのだと思う
すごーい、まだ若干違和感はあるもののほぼ超えてるな
>実在するニュースキャスターがニュースを読み上げる映像をレンダリングしてデジタル合成したもの
人間を写した映像なんだから仕草が人間的で不気味じゃないのは当たり前だよ
映像から3Dデータに変換するところでAIが使われているという話じゃないかな
目の完成度一つでここまで人間味を帯びるものなのか
谷を越えてヅラ疑惑。
ロボットだろうがCGだろうがなんでもかんでもAIって呼ぶのやめない?
不気味の谷は立体造形に限る。
口の中に何か入れてるみたいな感じする。口の開きが小さいのかな?
なんか口角の筋肉があんまり動いてないのに唇だけ異様に早く動いてるのがキモいな・・・
もう少し顎の骨をパクパクさせた方がいいと思うな。
これって「ローグワン」でピーターカッシングや若き日のキャリーフィッシャーを再現したあれに近い技術なのかな?
マックスヘッドじゃダメ?
AIというよりは、アバターの完成度かな。
ただ、リアルなCGを用いてまでニュースキャスターの姿を映す事に合理的な理由が無い気がする。
音声だけで良いんじゃないか?
やっぱり人間味や生気がない。ちょっとは笑わせようよ。
読み間違いをわざわざ訂正する手間と余計な感想を喋らなくなるのと24時間疲れを感じさせない喋りができるなら良いな、年を取らずに一生会社の専属(奴隷)として働ける(低賃金で)。
Unreal Engineのリアルタイムレンダリングでもかなりのクオリティ出してるし、
大統領とか、要人の影武者が3DCGで実現できそうっすね。
もしくは亡くなった俳優をスクリーンによみがえらせるとか
何も言われなかったら気づかないレベルまで来ているのは確か
日本がアニメやら萌えやらにうつつを抜かしている間にも
世界は現実の未来へ向けて着々と進んでいる。
見た目だけ良くて歌って踊れるロボットよりも
無骨ぜも災害救助や危険作業に役立つロボットの方が
人類にとって遙かに有益。
sayaは?
原稿読むだけの人間なんて要らないからAIでいいよ。原稿書いた人が自分で読むなら良いけどね。