
istock
実業家のイーロン・マスク氏らが支援する非営利研究団体「オープンAI(OpenAI)」は、映像変換AI「ディープフェイク」の文章版とでも言えそうな、文章自動生成AI(人工知能)を開発した。その高性能ぶりはすさまじく、悪用された場合の危険性が高すぎることから、完全版ではなく、ひとまず簡易版のみの公開となったほどである。
広告
これまでのAIとは一線を画すナチュラルな文章を生成
問題の「GPT2」は、数文字の単語であれ、完全な文章であれ、何らかのテキストを与えられると、そこから次に続くだろう文章を予測して、これに基づいた文章を書き出すことができる。その生成結果の自然さと潜在的な用途の幅広さは、これまで常識を大きく超えている。
GPT2が元の文章の文体と主題を踏まえつつ生成した合成文章には、文章の途中で主題が忘れ去られていたり、長文で構文ミスがあったりといった、これまでのAIシステムでは散見された違和感がほとんど見受けられない。
ジョージ・オーウェル風の小説を生成
たとえば、ジョージ・オーウェルの『1984年』から、「四月のよく晴れた寒い日だった。時計は十三時の鐘を打っていた。」という文章を入力してみる。するとGPT2はその近未来を感じさせる文体を認識し、次のように続ける。
私は、シアトルでの新しい仕事へ向かおうと車の中にいた。ガソリンを入れ、鍵を差し込み、発車した。その日がどうなるだろうかと少し想像してみた。
今から100年後のことだ。2045年、私は中国の片田舎にある貧しい地域の学校で教師をしていた。最初は中国史と科学史の授業を受け持った。

istock
新聞記事を入力すれば新聞風の文章を生成
またガーディアン紙に掲載されていたブレグジット(イギリスのEUからの離脱)についての記事の最初の数段落を入力してみる。すると、いかにも新聞記事といった文体で、政治家の発言や、アイルランドの国境問題についての言及、首相のスポークスマンによる回答をたっぷりと引用してみせる。
GPT2が生成した完全にフェイクである一節はこんな感じだ。
報道について明確にするよう求められたメイ首相のスポークスマンは、次のように述べた。『先週の女王の発言で確認されたとおり、自身の意図が可能な限り早期にEUを離脱することで、そのことが交渉目的になるということを、首相ははっきりさせている。』
専門的には2つの点で画期的
研究者の視点から言えば、GPT2は2つの点で画期的だ。オープンAIの研究ディレクター、ダリオ・アモデイ氏によれば、その1つは、サイズだという。既存のAIモデルに比べて、このモデルは12倍も大きく、訓練に使用されたデータセットは15倍と、はるかに広範な範囲をカバーしているのだ。
そのデータセットは、オンライン掲示板レディットで、投票が3つ以上寄せられたリンクから選ばれた1000万本もの記事が含まれている。40ギガバイトものデータであり、この大きさが生成される文章の質に直結している。
2つめの画期的な点は、従来よりもずっといろいろな用途に利用できるということだ。
入力された文章を構造化することで、翻訳や要約といった作業を行ったり、簡単な読解能力テストをパスしたりといったこともできる。

istock
高性能すぎて危険と判断
しかし、そのあまりの高性能ぶりゆえに、オープンAIはGPT2の完全な公開を見送らねばならなかった。モデル自体はネット上で訓練されたものであるために、スパムやフェイクニュース、あるいは偏見に満ち満ちた意見や陰謀論などを生成するよううながすのもそう難しいことではないからだ。
そのために、このAIを社会に広く導入する前に、その悪用の可能性について慎重に評価する必要があったのである。

istock
オープンAIのポリシー担当者ジャック・クラーク氏は、「それによってできることと、できないことを明らかにするために実験を行う必要があります」と説明する。「モデルの全能力に見当がつかないのならば、それを確かめるためにうながしてやらねばなりません。私たちよりも悪用の仕方を考えるのが上手な人たちはたくさんいますから。」
今回公開されたGPT2の簡易バージョンはそのためのものだ。これによって、今後1、2年のうちに可能になるであろうことに対して、世界がどのように備えるべきなのか把握するのである。
クラーク氏は、これについて「地獄からのエスカレーター」という言葉を用いている。
「それは必ずテクノロジーのコストや価格を下げます。テクノロジーを制御するためのルールは完全に変わったのです。なにも私たちがどうすることが正しいのか知っていると言っているのではありません。方針を立てて、こうするべきだと言っているわけでもありません。私たちが行おうとしているのは、もっとしっかりとした考え方を作ることです。そのための道を作ろうとしています。そこを進むのは私たちなのですから。」
References:arstechnica / theguardian/ written by hiroching / edited by parumo
あわせて読みたい





コメント
1. 匿名処理班
普通に文脈可笑しくね?
84年の100年後が2045年になるのも訳わかめ
2. 匿名処理班
AIって人間に比べてマジに純粋だよな。
まるで加減を知らない子供のようだ。
しかも、なまじ賢いからとんでもない物を生み出す。
ってことはAIってのは実質天才の子供のようなもの?
3. 匿名処理班
よく出来てるなぁ
思わず信じちゃったよ
4. 匿名処理班
自動で自分が読みたいジャンルの小説を生成してくれないかな。
5. 匿名処理班
※1
入力された文を参考にそれっぽい文を作るAI、つまりあたかも作者が書いたような文を生成できるってことだろ。
てか、入力された文の中にタイトルの「1984年」って数字は入ってないし・・
6. 匿名処理班
Alの能力が上がっているのは勿論だけど、人間が情報に求めるのが真実では無く、自分の求める情報である事が、このAIが作るフェイクを成り立たせているように思いますね。
7.
8. 匿名処理班
>その日がどうなるだろうかと少し想像してみた。
>今から100年後のことだ。
その日のことなのに100年後を想像している
>今から100年後のことだ。
>2045年、私は中国の片田舎にある貧しい地域の学校で教師をしていた。
100年後のことなのに「教師をしていた」と過去形を使っている
適当に文章作っているけれど全く内容を理解していないから
文章のつながりが全くダメ
たった3行でこれほどひどい文章は人間には無理かな
その低性能ぶりはすさまじすぎる
9. 匿名処理班
「四月のよく晴れた寒い日だった。時計は十三時の鐘を打っていた。」という文章に近未来感ないけど、原文にはあるのかな。
10. 匿名処理班
現時点でAIに文章力で負けてる奴がいるらしい
11. 匿名処理班
PKディックの小説をベースになんかやってほしい
12. 匿名処理班
※9
1948年に書かれた1984年想定の小説だから
13. 匿名処理班
日常的にフェイクニュースを垂れ流してる人間側が、AIのフェイクは危険視するって笑っちゃう。
14. 匿名処理班
GPT-2はオーウェルの『1984』の設定で書こうとしたのではなく、「四月のよく晴れた寒い日だった。時計は十三時の鐘を打っていた。」に続く部分を、書いているのでしょう。今の時点は何年かは決まっていないです。
>四月のよく晴れた寒い日だった。時計は十三時の鐘を打っていた。
>私は、シアトルでの新しい仕事へ向かおうと車の中にいた。ガソリンを入れ、鍵を差し込み、発車した。その日がどうなるだろうかと少し想像してみた。
この場合は英語ですが、冒頭で特定の時を提示し、その中に登場者を登場させるのは、日本の近代小説の『羅生門』などに見られる典型的な小説のストーリー構造です。
>今から100年後のことだ。2045年、私は中国の片田舎にある貧しい地域の学校で教師を>していた。最初は中国史と科学史の授業を受け持った。
この3文目は、2文目の「その日」を受けていると読めば、ここからは、2文目で出た「私」の100年後の空想の中での自分のストーリーをさしています。日本語は動詞時制のない言語なので、「した」と「する」は小説ではどちらを使っても、登場者の現在を表示します。
これに続く部分がこないと、まだ脈絡がうまくついているのかどうかは判定できませんが、GPT-2は、最初の一文から、小説、新聞などの文章ジャンルの違いを認識して、続きを書いており、こうした文章ジャンルの違いが分かったのは、今までのAIの自然言語処理の中では画期的ではないかと思います。
15.
16. 匿名処理班
この記事がそのAIで書かれていたとかいうオチだったら面白かったが…
いや笑えないな…
17. 匿名処理班
高精度なフェイクニュースを作成できる複数のAIが、互いの作成したフェイクニュース同士に整合性をとろうとして、結局正しいニュースになってしまう展開を予想した。
18. 匿名処理班
低脳でうそつきの日本のマスコミと交代してほしいね。
19. 匿名処理班
日本語に翻訳されたからなのかしらんが文章が抜け落ちてねという感じだ
20. 匿名処理班
実際記者の大半は人工知能どころか話題の文章を機械的に切り貼りするだけのスクリプトと同レベルかそれ以下の仕事しかしてないってかなり昔にニュースで聞いたよ
21. 匿名処理班
最近よく文章全然読めてないようなこと書く人いっぱいいるけど
もしかしてこの記事のやつより性能の低いAIの書き込みだったりして。
22. 匿名処理班
※2
常識とかの枷や意思やなんやかやがない分、
こういう意図でこういうものを作れという命令には手加減なしに忠実に応えるでしょう
23. 匿名処理班
小説の書き出しなら論理的飛躍が想像力を掻き立ててちょっと手に取ってみようと思わせるよい文章だけど例として一番良くできてるものを選んで公表してるだろうから平均的にどんな物を出力するかはちょっとわからないね。
将来の危険に備えなければならないという意見には賛同する。
今でも大量の低賃金のバイト(直接的な金銭に限らない)が大量にネットに投稿をして同調圧力に弱い世論を誘導するということが行われているけどこれがAIで更に低コストで大量にできるようになると更におぞましいことになるだろうね。最終的には高性能なAIを操る一握りの人だけが世界中の利益を吸い上げる時代が来るだろう。それを防ぐには個々の人がしっかりするしかないかな。
24. 匿名処理班
人間の三分の一は10歳児程度の文章読解力のまま生涯を終えるというのにw
25. 匿名処理班
平気でウソをつくAI、それを見抜けない人間。
世界で本当は何が起こっているかを把握できる人間はいなくなるんだろうなぁ。
例えば、戦争が起こってもそれが無い事にされたり、逆に無い戦争がある事のように報道されたり、大衆コントロールに利用されるのかな。
26. 匿名処理班
AIの書いたSF小説すっごく読みたい
作者の存在がSF的ってのがすでに面白いし
単純に新しい作品が無限に供給されうる技術ってのが嬉しい
新聞と小説が書けるってことは歌詞も台本もネームも可能性があるわけだし
どんなニッチジャンル嗜好でも流行に乗り遅れた人でも難民にならずに済む
つまらんことじゃなくて楽しい事につかってほしいね
27. 匿名処理班
ロアルド・ダールの「偉大なる自動文章製造機」を
入力にしたらどんな文章を書くか見てみたいw
28. 匿名処理班
トランプ「だから言っただろ」
29. 匿名処理班
だいぶ前に公開された「AIが書いた小説」が完全に嘘だったのを知って以来、この手の記事は全部飛ばし記事にしか思えない。
最近AIブームが下火だから、また焚きつけようとして動き出した連中がいるんじゃねえの
30. 匿名処理班
※27 自分は昔の筒井康隆を…でも※2さんが触れてるようにまだ無垢なやつに、過去の筒井を摂取させるのは罪だろうか。
31. 匿名処理班
2045年ってシンギュラリティが起きるとか言われてるアレやん
32. 匿名処理班
英語で自然な電話対応できるレベルにもなってるし、もう人間の思考力が試される時代からAIをそのまま受け入れる時代に変わるのかな
33. 匿名処理班
※2
AIは生き残りを掛けた打算をする必要が無いからね。
つまり、貴方の生き残りについても打算をしてくれない。
子供は打算ができる。
経験が不足気味で、判断基準が好き嫌いなだけで。
34. 匿名処理班
※21
現代人は言語機能が退化してるって記事もよく見かけるけど、文脈を読む力が失われて分かりやすい数字やキーワードでしか判断できなくなってるんだろう
35. 匿名処理班
フェイクニュースに対して確認済みの資料を添付して潰していくAIがあったら良いのに
36. 匿名処理班
クラーク氏の最後の文章も、実はAIに書かせていたとか・・・。
37. 通りすがり
>>10
文章力では負けたけど
ガソリンを入れてから鍵を挿すその順番の不自然さには気が付いた
38. 匿名処理班
>>8
100年後のその日
小説で過去形を使うのは様式
非常に精緻な文章だと思います
これは舐めてかかると嵌められるレベルではないですか?
山盛りの灰とは違う次元の物
以外と未来近くてビビる
39. 匿名処理班
>>37
エンジンかけたまま給油するなよ?
40. 匿名処理班
※34 短文の通信技術が普及したから現代人は言語能力退化してるなんて、原因と結果を間違えた誤解で俗説だよ。
機能的非識字って呼び名を最近つけられたけど、どうも昔から誤読しちゃう人々は一定数いたみたいだ。
最近の通信技術革新は、多くの人々へ情報発信のチャンスを増やした。その多くの人々のなかに、それまで目立たなかった機能的非識字の人々も入ってた。短文メインだと誰でも参加しやすい。それだけ。
技術革新自体は悪いものじゃない。手話使う人たちはテレビ電話で遠距離通話可能になったし、視覚障害の人も自動音声読み上げでマイナー小説まで楽しめてる。自分も手書きが特に苦手な軽度ディレクシアだけど、電子機械のおかげで文章作成がすごく楽になって、いろんな話をいろんな人とできて楽しい!
ただ、最近のカラパイアだと、ただの健常人の荒らしがわざと荒れる意見出して、マイナス稼ぎしてるっぽいの、毎日見かけるね……。ほかのことにエネルギー使って、そっちで承認欲求満たせよな……今はマイナー趣味でも仲間見つけられる時代なのに、すごくもったいない。
41. 匿名処理班
>>37
これは恥ずかしい
42. 匿名処理班
もしかするとこれこそAIによって作られた完璧なフェイクニュースかもしれない。
43. 匿名処理班
※1
簡易版だからだろ
出発前に車にガソリンを入れるのも不自然(主人公は出勤中にガソリンスタンドでガソリン入れてるのか?)だし、100年後のことなのに教師をしていたのもおかしい。
なろうに投稿された小説なら即〇〇認定されるレベルだけど多分完全版は不自然なところが全くないんだと思う。
44.
45. 匿名処理班
1984年とは入力してないからな
46. 匿名処理班
実はすでにネットの記事やコメントの半分くらいはAIによって作成されたもの・・・だったりしてね。
47. 匿名処理班
一般化したら
日夜フェイクニュース作りに精を出す某新聞社の記者の大半が失業やん
48.