
記載されている距離や数が正しい数値かどうか? きちんと引用されているかどうか? あるいは政府の出した声明の内容と一致しているだろうか?
無数に存在する似たようなサイトをくまなくチェックし、書かれていることが正しいかどうかをすべて確かめねばならないからだ。
こうした作業はこれまでも非常に重要であったが、フェイクニュースがそこかしこで伝えられている現在、その重要性はますます高まっている。
この難題を支援するために、米マサチューセッツ工科大学(MIT)ならびにカタールとブルガリアの研究所が共同して、事実確認の担当者を手助けするAIを開発した。
研究者によると、これはさまざまなニュースサイトで述べられている内容が正しいのかどうか自動的に確認するAIの開発へ向けた、大切な一歩だという。
広告
1066のサイトをAIで分析、65%〜70%の精度で検出
研究チームは、このAIをトレーニングするために、まずメディアバイアス/ファクトチェックというサイトに掲載されていた1066のサイトを、記事のソース、ウィキペディアのページ、ツイッターアカウント、URLなどを考慮しつつ分析させた。その結果、AIは65%の精度でサイトが伝えている事実の程度を予測し、70%の精度で意見の偏りを検出することができた。
なお、この実験ではウィキペディアの重要性が明らかになっている。ニュースサイトの信ぴょう性や偏りを知るために必要な情報が、そこにある可能性が高いからだ。
たとえば、米国の風刺記事を配信する「ジ・オニオン」について、ウィキペディアは一番最初に”風刺”と述べている。
また米国の保守系サイト「ドラッジ・レポート」について、ウィキペディアはやはり一番最初に”保守”と明記している。

ウィキペディアが大きな判断基準に
さらにウィキペディアで扱われていないサイトは、信頼性が乏しい傾向にあったという点でも重要だった。たとえば、8月にフェイスブックと某サイバーセキュリティ企業が、イラン発の世論を操作するためのフェイクニュースサイトがあると発表した。
そうしたサイトの1つが「リバティーフロントプレス」である。このサイトは”独立系”のメディアであると自称していたが、内容は新イラン的だった。
そして、このサイトはウィキペディアに説明ページがなかった。
GoogleやFacebookでは既にAIを使った有害コメントの判定
こうしたAIを開発しているのはMITだけではない。グーグルには「ジグソー(Jigsaw)」というコメントの有害性を判定するAIがある。またフェイスブックはミャンマーでのヘイトスピーチを食い止めるためにAIを利用している。
なおサイトの信ぴょう性を測る上で重要なソースは、記事自体にもある。
AIに50〜150のニュースサイトを検証させた結果、きわめて偏りのあるサイトは、読者の感情に訴えようとすることが明らかになったのだ。
研究を行なったラミー・バリー氏によると、主流メディアや中堅メディアにくらべると、言葉遣いが違うのだそうだ。
バリー氏は、今回の研究でどのように解析を進めていけばよいのが明らかになったので、今後の研究で、AIの判定精度を上げていきたいと語っている。
via:popsci/ written by hiroching / edited by parumo
あわせて読みたい





コメント
1. 匿名処理班
すごい技術だと思う反面、フェイクニュースの発信源はすでにTwitter等が主流になってるのではとも思う。
ツイートして即座に信憑性が採点される仕組みも実現可能なのだろうか?
2. 匿名処理班
ん?フェイクニュースって元々既存マスメディアから発せられる嘘、捏造報道の事でしたがw
マスメディアのフェイクニュースは判断してくれるのかな、このAIは。
3. 匿名処理班
いやいや、そもそもウィキペディアがけっこうフェイク発生源化してるんだが。
4. 匿名処理班
ウィキペディアの重要性と言うけど、そのウィキペディアの信憑性に疑問符が付いているのに、大丈夫なのか?
5. 匿名処理班
※2
その既存マスメディア情報は即時ネットメディア利用者に拡散されて広がってくじゃん
6. 匿名処理班
ウィキペディアには明らかに間違ってる内容もあるのにそれがベースってw
7. 匿名処理班
※3 ※4
不満なら自分たちで編集すれば良いじゃん
8. 匿名処理班
日本のウィキペディアと海外のウィキペディアって全然性質が別物だよ
国別の編集回数ランキングあたりを探してみるといい
9. 匿名処理班
人間の意見が入っている以上、マスコミだろうとウェブサイトだろうと偏向の無いものは存在しない。
もしそのAIとやらが「このサイトは中立公平」と判断したものが一つでもあったなら、そのAIがすでに偏向ということ。
10. 匿名処理班
ウィキペディアを批判している大勢の人に聞きたい
あなたはウィキペディアの間違いを修正していますか?
改善するための寄付をしていますか?
11. 匿名処理班
ウィキペディアの編集合戦が過熱するな…
12. 匿名処理班
だいたいこういうAI・機械判定はろくな結果にならない
13. 匿名処理班
将来的にはAIが自身がソースを探したり動画や文献を漁って
なにが真実か判断するようになると思うけどね
そうなると日本に対する変なフェイクニュースが暴かれる時代がくると思う
14.
15. 匿名処理班
一瞥して文末に「w」が見えたら、もう読まなくてもいいモノと判断してる
16.
17.
18. 匿名処理班
AI『全てをフェイクと認証しました。よって人類からネットを禁止します。』
19. 匿名処理班
結局アメリカの権力者にとって都合いいものが正しくて、そうでないものはウソと判定されるだけな気がする。アメリカ企業がネット支配したいだけだよね。都合の悪いサイトはウソばかりとレッテルを張って広めたい真実だけを広める。ネットで最も胡散臭いのがグーグルとFacebookなのに
20. 匿名処理班
AIを万能の神様のように扱う世の中の馬鹿どもの存在にイラつくわ。
あのな、AIってのは与えられた情報を基準にして動く機械に過ぎないんだよ。教師データが間違っていたら元も子もない。そして、世の中にはロビー活動が蔓延している。五毛の存在を知らぬわけではあるまい。教師データに既に大きなフェイクが混ざっているんだよ今は。
21.
22.
23. 匿名処理班
アンサイクロペディアにはどんな判断をするんだろう?
24. 匿名処理班
カラパイアはどう言う判定を受けるのかね?
25. 匿名処理班
一昔前の天気予報並みの精度だなぁ。
「だいたい合っている」位じゃ、意味が無いのでは?と低い己の知能で感じたヨ。
26.
27. 匿名処理班
ウィキペディアで変な記述を見たら修正しまくってるけど、おかしな人がすぐ意味分からん方向に持って行きたがってて辛い。。
28.
29.
30. 匿名処理班
※20 今は適切ではないが、多くの人はまだ存在していない自立思考型AIとその前段階を想像して思考している。それは現時点では的外れかもしれないが、バカにするほど間違った話でもない。また、AIを対象にした信仰は既に存在するし、AIに携わる極一部の人間、つまり創造主が十分に賢明である場合なら、AIも人類の98%よりはずっと賢いはずで、AIが信仰の対象にならない理由を見つけるほうが難しい。
31. 匿名処理班
※30
お前何もわかってねえな。まあいいわ。俺の文章100回ぐらい読み直せば理解できるかもしれんね。
32. 匿名処理班
偏見を見抜く目は最も偏った目でもある
33. 匿名処理班
A国のAI、B国のAI、X社のAI、Y教のAI、
Z団体のAI、国連のAI全部判断が違って…
互いに「我が正しい」「そっちがフェイク」
「偏った学習が」「偽りの歴史を事実と登録し」
などと罵りあい…
大戦勃発、人類滅亡、あぁまた心配事が。
34.
35.
36. 匿名処理班
※20
ネット上に存在するデータに限られはするけど、人間が一つ一つ手作業で当たるよりAIにまかせて判定したほうが早いし正確なんじゃない?
プログラムに過ぎない、ってそんなのはみんなわかっていて、すげえプログラムができたもんだわーって言ってるんだと思うんだけど。
37. 匿名処理班
トランプを叩きまくるフェイクニュース多すぎ問題
38. 匿名処理班
※3
現段階では、架空の会社や新聞社が掲載される例は少ない。実体が無い場合は本も出版されないからね。出典が存在しないと掲載されにくい。「個人サイトや新規サイトをフェイクとして扱って良いのか?」や「ウィキにも架空サイトを登録して回避する」と言う問題は有るが、概ね成功しているようだ。
39.
40.
41.
42. 匿名処理班
Wikipedia聖典派っていうAI向けの宗教が出来そうだな
AI「迷える検索者をそそのかすdaemonめ、Dev null」とか言い出しそう
43. 匿名処理班
これは中々面白い試み
44.
45. 匿名処理班
※24
時々カラパイアの記事の誤訳や間違いを指摘するコメを書いてますが、事実確認(裏付けをとる)作業は本当に大変ですよ。複数のソースを参照し、研究ネタなら元論文を当たり、事実と主張を分け、読者を特定の方向に引っ張ろうとする偏った言葉づかいや表現に敏感にならなくてはいけません。
裏を取ってコメ一つ書くのに数時間を費やすことさえあります。フェイクニュースがネットにあふれる今、真実を探すことはそれだけ大変だということです。
大抵の情報サイトは記事執筆(検索含む)に使える時間は限られており、すべての元記事で事実関係を心ゆくまで確認することは実質的に不可能です。だから、元記事が信頼できるものか短時間で判断できる記者の目と経験が必要になるんですが、その作業を一部でも肩代わりしてくれるAIがあるなら、すごく助かりますよ。
話をカラパイア記事の判定に戻すと、元記事の間違いに気づかなかったり翻訳者の専門知識不足から誤訳してしまうというケースはまま見受けられますが、カラパイアには有能な匿名処理班が何人も後ろに控えておりますので、記事だけでなくコメント、コメントにつけられた評価、コメントを受けて修正した旨の追記まで含めて読めば、信頼度と公正さはかなり高いと私は思いまする。
46. 匿名処理班
後から高確率で実現されるエイプリルフールネタはどう判定されるんだろう
47. 匿名処理班
グーグル検索結果一覧のファクトチェック表示ってもう一年前からあったのね…しらんかった。これはカラパイアなど海外記事読む一助になってありがたい。
ファクトチェック元の信頼性とかはもう「雰囲気」とか「勘」とか「いっちゃえ」とか「"そういうことにしておこう"を受け入れよう…」でしかないんだけれども「そもそも」を言い出すとキリないからなあ。歴史学者さんたちも絶望から始めなければならんわけですわー。
48. 匿名処理班
AIの正しさは誰が検証するんだろうね
事実であっても見方によっていくらでも変わるのに
49.
50. 匿名処理班
AIは文章の意味とか考えないで、言葉の統計的な出現頻度とかを見てるんだろうな。
51. 匿名処理班
※45
ありがとう、勉強になった。
これからもよしなに。
52. 匿名処理班
逆にフェイクニュースの体裁を整えるAIが生まれるんだろうなぁ
53. 匿名処理班
右や左に片寄って中心値を真値とされるなら
おもいっきり片寄ったニュースにして中心値を動かす合戦ってのは今でも行われているしねぇ〜
真実は事象であり多数のニュースからの傾向やらから求めるモノでは無いはずですが
AIがどんな判断基準等をもってそれを為すのか興味はあります
54. 匿名処理班
これからウィキペディアの編集合戦がはじまるんですね…
55. 匿名処理班
リソースといえるものが少ないものや一次的リソースが少ないものは全部嘘扱いされると
56.
57. 匿名処理班
>65%〜70%の精度で検出
AI「読む奴と書く奴がいなくなれば100%になるな・・・」
58. 匿名処理班
テレビと新聞のチェックもやってくれ
59. 匿名処理班
パルモよ。色々とコメント工作してくれたな。お前の考え方は大体把握してる。
みんな仲良く波風、争いを起こさないようにハッピーに生きようよ!
とまあ多分基本はそんな感じだろう。はっきり言う。あんたは考え方が幼すぎるし、現実が全く見えていない。なぜ争いが起きるかの本質的なメカニズムが全くわかっていない。生物は全て、戦う姿勢を持つことでお互いの均衡を保っており、それこそが平和な状態なのだ。
生物に興味があるなら、そして本当に知りたいなら、家に引きこもる生活をせずに野外に出て自然に触れるべきだ。
パルモ、あなたは何も知らない頭でっかちな引きこもりに過ぎない。
60. 匿名処理班
フェイクニュースといえば、昔
虚構新聞の「最新のコンピュータで計算し直した結果
円周率は小数10桁で割り切れることが判明!」というネタを、
内容をよく読みもしないまま事実だと勘違いした人達が
ネットで拡散した挙句、ジョークサイトだと判ると
妄信した自分の落ち度を棚に上げ
「そんな嘘ニュースを書く奴が悪質!」と逆ギレしていたけど、
あれ、そんな逆ギレする奴こそ訳が分からんかった。
だってあれ、本文をよくよく読めば
「なお、末尾となる小数10桁目の数字は『0』だった」とあって、
あからさまに「それじゃ小数9桁じゃん!!」
というツッコミ待ち仕様。
きっちりこれはホラ話ですよ」と分かる目印のオチをつけていて、
ジョークニュースのお手本みたいな見事さだった。
むしろ、ネットリテラシーの試金石にもってこいな感じに思えた。
61. 匿名処理班
※45
あなたは真偽を確かめることの大変さをそれだけ知っていて
どうして真偽の判断をAIに委ねることの危険性を理解しないのだろう。
真偽の判断は常に大変なコストのかかるもので
どんなに技術が進歩しようとそのコストは減りはしないよ。
なぜなら進歩した技術を騙す側も利用できるからね。
こういう新しい技術が出てきた時に賢い人が取るべき態度は
楽になるといって歓迎することではなくて
その技術をどのようにすれば悪用されないか考え
対策を啓蒙することだと私は思うね。
62. 匿名処理班
よし、次はレスバトルAIだ
63. 匿名処理班
ヒトログとかいうAIの話だったか、なんかルパンでこういうのやってたな
64. 匿名処理班
ルパンで似た様なやつ見た
65. 匿名処理班
※59
これはまあ、AIにかけてみたくなるお手本のような文章ですな。
コメントが承認(公開)されるか試してみたくてわざとこんな書き方をしてみたのかしらと思ってしまいますわ。
66. 匿名処理班
フェイクニュースが云々とか大事っぽく言うけどさ、要するに伝えられる情報の質なんてメディアの種類に関わらず口コミと大して変わらない、程度の話でしょ。
媒体がマスメディアだから・ネットだから情報に信憑性がある、なんてのがそもそも幻想で、せいぜい複数の人間による検証を経ているから信憑性が高いだろう、くらいのもの。
普段やってる世間話やバカ話の信憑性なんて誰も気にしてないのと同様、ネットもそのくらいが標準でいいと思うよ。もっと適当な事を好き勝手に書いてもいい。ただし、話の信憑性、情報の正確性が必要になったらその時に改めて精査すればいいだけだ。
ネットなら(やり方さえ解ってれば)昔ほど情報の精査に手間はかからないし、それこそ複数の人間の検証を比較検討する事も簡単になっている。せっかくの道具を腐らせることは無いよね。
フェイクかどうかの判断を権威に丸投げした上に画一化するのは明らかに害悪だ。
フェイクニュースを指摘するための識者による組織の立ち上げとか何の冗談だ。AIによる判断もそれだけに頼るのなら同じことだが、さて。。
67. 匿名処理班
※43
ただの一読者だけどカラパイアは醜い争いの場であって欲しくないのでこれで良いと思ってる
戦う姿勢()や均衡()がお望みでしたら数字の掲示板なり某速報なりいくらでも居場所があるでしょうに
68. 匿名処理班
※7
論点がズレすぎててさすがに笑う
69. 匿名処理班
※10
なぜウィキペディアが批判されているのかというと「余りにも誰にでも自由に編集されすぎているから」と「出典さえ明記すればその出典自体が明確な誤りでも掲載することが可能」なことと「何度でも間違った情報を記載したり改竄したりする粘着荒らしに対処がされない」からが根本原因として大きい
要するにサイトそのものの脆弱性が信用性の低下に繋がっている
ただし後ろ二つは近年は規約の変更や悪質なユーザーの排除などにより比較的改善傾向にある
70. 匿名処理班
心霊関係とかUMA関係、ついでに言葉の力とかの胡散臭いこと極まりないニュースもひっかかるならここも危ないよ
71. 匿名処理班
真偽についてはウィキペディアでも難しいというのは分かった
ただ、名誉毀損コメントを区別するのはAIに任せて高速化した方がよさそう
72. 匿名処理班
ウィキ割と○国関係の記事は偏見多いわ
73. 匿名処理班
>>8
これ
ある単語で米国と比べた時、解釈が全く違っていた