メインコンテンツにスキップ

AIがネットの匿名性を暴く。SNS投稿やわずかな書き込みからユーザーの正体を高精度で特定

記事の本文にスキップ

32件のコメントを見る

(著)

公開:

この画像を大きなサイズで見る
Image credit: b-bee
Advertisement

 チャットGPTやジェミニなどに使用されているAIが、ネット上の何気ない書き込みから、匿名ユーザーの正体を高精度で特定できることが最新の研究で明らかとなった。

 スイスのチューリッヒ工科大学などのチームは、AIが投稿者のわずかな特徴から人物を絞り込む「推論」を行うことで、SNSやブログ、匿名アンケートなどの内容から実世界の人物を割り出すことに成功した。

 しかも瞬時に特定ができるため、ネット上のプライバシー保護という前提が、根底から覆されようとしている。

AIがネットの書き込みから身元を特定

 インターネット上では、匿名で様々な場所に書き込みができる。文体や人格を使い分け、何人もの人物を装うことも可能なため、どこの誰なのかを特定することは難しい。

 もちろん、誰かを傷つけたり、法に反する書き込みは、法的手続きによりIPアドレスなどの情報を開示させることで投稿者を特定できるが、それには時間とお金がかかる。

 しかし、最新のAI技術はこうした通信記録に頼ることなく、書き込まれた文章そのものから瞬時に正体を割り出せてしまうという。

 スイスのチューリッヒ工科大学とAI企業アンソロピックの研究チームは、膨大なテキストデータを学習し、高度な自然言語処理を行う「大規模言語モデル(LLM)」というAI技術を利用し、オンライン上の匿名ユーザーを高い精度で特定することに成功した。

 LLMはOpenAIのチャットGPTやGoogleのジェミニ、アンソロピック社のClaudeやXのGrokなどの対話型AIに使用されている技術だ。

 この研究は、まだ専門家による検証(査読)を受けていない段階の論文として公開されたものだが、AIが匿名を暴く強力なツールになり得ることを示唆している。

 研究チームは、これまでユーザーの身元を物理的に保護してきた仕組みが、AIによって機能しなくなることを懸念している。

この画像を大きなサイズで見る
Image credit: Ton Photograph

雑談から正体を見破る。言葉の癖を読み解くAIの推論能力

 AIによる特定は、通信記録(IPアドレス)を辿る従来の方法とは全く異なる。

 AIは投稿された「文章の中身」そのものを分析し、わずかな情報の断片を繋ぎ合わせてパズルのように正体を割り出す。

 実験では、技術系掲示板のハッカーニュース(Hacker News)や掲示板サイトのRedditでの書き込みに加え、ビジネス向けSNSのLinkedInのプロフィール情報、さらにはネットフリックスの視聴履歴データなども分析の対象となった。

 AIは、これらの膨大なデータ群を横断的に解析することで、個人の特定に繋がるヒントを抽出していく。

 たとえば、何気なく投稿された「近くの公園の桜が綺麗だ」といった地元の話題から居住地や活動範囲を絞り込み、さらに仕事に関する専門用語から、その人物の職業や役職、時には勤務先までも特定する。

 あわせて、投稿が行われる時間帯の傾向から生活サイクルを割り出し、それらを公開されている様々なプロフィールや過去の行動データと詳細に照合している。

この画像を大きなサイズで見る
Image credit: Urupong

人格や文体を変えても。AIは隠れた同一性を瞬時に見抜く

 たとえネット上に実名登録をしていなかったり、意図的に文体を変えて別人を装っていたりしても、AIの目をごまかすことは難しい。

 人間が意識的に作り出した「嘘の設定」や「偽装した文体」の背後には、言葉選びの微細な癖、句読点の打ち方、あるいは無意識に漏れ出す専門知識の偏りなど、その人固有のパターンが必ず残るからだ。

 AIは人間が見逃してしまうようなこうした小さな共通点をウェブ上の膨大な公開情報と照らし合わせ、断片的な情報の奥に潜む「実社会の個人」を論理的に導き出すのである。

 この手法は、特定のプラットフォームに限らず、ブログのコメント欄や匿名アンケート、ネット上のあらゆるテキストに適用される恐れがある。

 さらに注目すべきは、その処理能力の高さだ。

 これまでは、特定の匿名アカウントの正体を突き止めるには、専門家が過去の投稿を数時間かけて精査する必要があった。

 しかしAIは、この複雑な分析とウェブ上の公開情報との照合を、わずか数秒という速さで完了させる。

 さらにAIは、この作業を数万人規模で同時に実行できる能力を持っている。

 研究チームのサイモン・レルメン氏は、匿名化された自由な形式の文章からでも、AIが個人の身元を即座に導き出せると述べている。 

この画像を大きなサイズで見る
Image credit: Evheniia Vasylenko

特定の精度は最大90%。趣味の話題から身元が判明する恐れ

 今回の実験における特定の精度は非常に高い結果となった。

 AIは、調査対象となったユーザーの約3分の2を特定し、その予測が正解である確率は最大で90%に達した。

 例えば、Redditの映画コミュニティでの発言を分析した実験では、特定の映画について詳しく語れば語るほど、AIがその人物を特定しやすくなる傾向が見られた。

 また、アンソロピック社が行ったAI利用に関するアンケートへの回答であっても、AIは約7%の確率で個人を特定できたという。

 自分だけの趣味や知識について語るという、ネット上の何気ない楽しみが、結果的に自分を特定するためのヒントになってしまう可能性が指摘されている。

この画像を大きなサイズで見る
Image credit:tadamichi

監視や詐欺への悪用も。ネット社会に迫る新たな懸念

 この技術が普及すれば、プライバシーのあり方は根本から変わる可能性がある。

 政府が反体制派やジャーナリストを特定して監視に利用したり、企業が匿名投稿を顧客データと結びつけて勝手にプロファイリングを行ったりするリスクが考えられる。

 さらに、悪意のある攻撃者が個人の情報を大規模に収集し、その人に特化した詐欺を仕掛けることも可能になる。

 研究チームは、プラットフォーム側が情報の自動収集を防ぐ対策を講じるべきだと主張している。

 今のネット環境において「匿名」という仕組みが、AIの前では崩壊する可能性があることを、我々は肝に銘じておかなければならない。

この査読前の研究成果は、『arXiv』(2026年2月25日付)に公開された。

References: Arxiv / LLMs can unmask pseudonymous users at scale with surprising accuracy / AI Can Mass-Unmask Pseudonymous Accounts, Research Paper Finds

📌 広告の下にスタッフ厳選「あわせて読みたい」を掲載中

この記事へのコメント 32件

コメントを書く

  1. 具体的にどんな感じになるのかわからんな
    多少のことは人間でもわかるし

    • +4
  2. う〜ん この方法だとプロファイリングから個人の特定までの間のプロセスがちょっと跳んでない?
    それが出来たら警察の苦労はなんなのかっていう

    • +7
    1. 今後は警察もAIを駆使したプロファイリングをするようになるだろうな

      • 評価
  3. 書き込み前にAIで編集してごまかさないとですね。

    • +19
  4.  その昔、掲示板システムが華やかなりしころ特定班な人たちが同定していましたね。 文章の癖や語彙・知識など確かにその人固有のものがあるから情報を得られれば得られるほどわかりやすいという AI の得意分野な気がします。 こんな使い方はこの記事を読むまで思いつきませんでしたが、納得です。 まぁ、ストーキングで瞳に写った景色からどこに住んでいることがわかるような恐ろしい人たちもいますので AI が追い付くまでもう少し時間がかかるかな

    • +13
  5. よ、余計なことを~
    ランプの魔人かよオメエはよぉー!

    • -3
  6. あるゲーム動画で荒らし主がたった”、、”の癖文章で
    誰かがわかったことあった
    たいていの人ってどんなに隠していても文章へ癖が残るので
    AIでなくても見分けられる
    将来的にはその癖で、その人の性格や本性わかる日も近い

    • 評価
  7. これからは web に書き込む前に、AI を使って「この文章をトランプ大統領が書いたみたいに変更してくれ」といった修正をしなければならないのか。
    面倒だね。

    • +15
  8. CIA「前からやってたし、今さら何をwww」

    • -2
  9. ネットの匿名性ってAI使わなくてもゼロだよな。
    今でも事件や問題起こしたコメント主の特定はあっさりできる
    AIを使いより高速化・効率化できると言うだけだろう。
    まあ結論から言えば誹謗中傷しなきゃいいんだよ。

    • +2
    1. 全く違わない?
      犯罪予告や誹謗中傷などで、捜査の対象になったり民事訴訟での開示請求をしたりする場合、調べる側も身分を明かして正当理由を提示しなければならない。

      AIで勝手に素性を探るのは、レスバで負かされて気に入らない相手の個人情報を入手して晒し上げたり、嫌がらせ電話を掛けたり、有名人のプライベート用のアカウントを見つけてリアルの住所に突撃したり、悪意ある個人へ容易にプライバシーの侵害を行う手段を与えてしまう。

      • +11
  10. これは自分も思ってた
    選択語彙や構成句読点やら様々な要素で個人の癖が出るし、個人の識別ができる
    だから自分はIDと絡んでるSNS等では発信をしなかった
    まさかAIがそれをやる時代になるとは思わなかったが

    • +17
  11. それ見越して文体も論理も切り替えてるからへーきですw
    掛かってこいやクソザコAI

    • -14
    1. AI「うーん、この時間に書き込んでいるということは、あなた働いていませんね?」

      • +8
      1. お昼ちょっと前にトイレの個室でカラパイアの可能性もあるぞ

        • +2
  12. 海外だとメタのFacebookは実名でする人がほとんど。
    日本だと、実名でSNSに書く人はほとんどいないので特定は難しいのでは、

    • +11
    1. Webサイトを訪問するだけでCookie等を使ったクロストラッキングによって、その端末の仕様や挙動の特徴が収拾・解析・販売されている。
      それらの公開情報を組み合わせるだけでも個人は高精度で特定できる。これをサードパーティ識別子という。

      実名を公開しなかったとしても、ネットを使うだけで個人は特定されてしまうよ。
      ネットの匿名性なんてものはVPNとかで対策しない限りは公共の広場と同程度だと思っていた方がいい。
      (サードパーティ識別子は公式には公告のパーソナライゼーションのために収拾・販売してるってことになってるが、まあ国家当局も当然監視のために使っているだろう。禁止する法律がどの国にも無いので)

      • +3
  13. カラパイアのコメント欄では使わないでほしいw

    • +12
    1. 真面目な学術的話題であっても、
      息子スティック系の書き込みを知られるのはね…

      • +15
  14. 量子コンピュータの手にかかればこんなのすぐに結果が出るでしょうね

    • -4
  15. つまり現状、ネット上の特定班がやっているようなことを
    AIがパパッと素早くやっちゃいますよってことだよね?
    画像の中の瞳の反射から場所を特定とかしてたのはたまげたなー

    • +9
  16. マーケティング会社やMEME会社とかが常備してる一般人に装ってるようなAI botが投稿したやつとかはAIも「てへ、なんだお前かあ」ってAI同士でなるのかな

    • 評価
  17. 特定班が理路整然とこいつとこいつは別人ですよと諭しても
    でもAIは同一人物だって言ってる!っつって誹謗中傷するやつも出てくるんだろうな

    • +9
  18. SNSのアカウントを本体として結びつけるのだと思う
    そして対になってるのが匿名掲示板で憂さ晴らしというスタイル
    それは見抜かれやすいものでもある
    いかにSNSがハイリスクなのかというのもよく判る
    AIでの文体誤魔化しが通用しないのは主張を変えられるわけでないということだろう
    主張をねじ曲げれば特定はできないが目的は達せられないよね
    そこに脆弱性がある

    • +2
  19. 権力者が己に批判的な人物を監視するのに便利そう

    • +2
  20. 絶対に平和利用されるように迅速な、国際的な法整備が必要だと思う。
    イカれた国の政府が悪用したらなんとかに刃物で、ちょっと批判的なことを呟いたら死刑みたいなことになりかねない。

    • +9
  21. 絶対に不可能だ

    住所氏名を入力しないのだから

    • -1
  22. むしろ逆の効果があるのではないでしょうか。こうしたリスクが判明すれば、そのまま投稿する人は減るはずです。投稿時にAIフィルタリングを通すような仕組みを標準のUIにすれば解決する問題だと言えます。

    • -1
    1. どこに句読点を入れるか、何文字くらいで改行するか、ひらがな・カタカナ・漢字どの表記を使うか、日本語の熟語とカタカナ外来語どちらを使うか、方言を混ぜるか、語尾の言い回しをどうするか、感嘆符や疑問符をどの程度使うか、カッコや数字など半角全角、接続詞で一文に繫ぐか二文に分けるか、倒置法を使うか、比喩を使うか(どういった傾向の比喩が多いか)、故事成語や諺を頻繁に引用するか、個人の体験談を例示するか抽象的な一般論に留めるかetc….

      ちょっとした「文章の癖」一つとっても、それはその人の「自己表現」であり、それを無味乾燥な一律の無個性文へ変換しなければ発表できないような世の中は、人間の尊厳と自由に著しい制約を加えるディストピアだと思う。

      第一、文章のニュアンスというものはものすごく繊細で、「どうせ意味は同じだろ」で荒っぽく変換してしまうと、時にテニヲハ一つで主張の印象がガラッと変わってしまう。

      • +3
  23. 割と簡単に語順や助詞が入れ替わる日本語の弱点が出てきてしまったな。

    まあ、それで日本人の書いた文章なのか、はたまた別の国の人間が書いた文なのか判別できたからAIにも出来ない筈は無いんだが、逆に日本語の方が個人の同一性が判明しやすい弱点にも繋がるんだろうな。
    たまにギャル風なんかに文体を変えて遊んでいた事があるが、それも見破られるんだろうな。

    • 評価

コメントを書く

0/400文字

書き込む前にコメントポリシーをご一読ください。

リニューアルについてのご意見はこちらのページで募集中!

サイエンス&テクノロジー

サイエンス&テクノロジーについての記事をすべて見る

  1. 記事一覧を読込中です。

料理・健康・暮らし

料理・健康・暮らしについての記事をすべて見る

  1. 記事一覧を読込中です。

最新記事

最新記事をすべて見る

  1. 記事一覧を読込中です。