メインコンテンツにスキップ

科学論文に潜むAIの痕跡、1500万件の大規模分析で明らかに

記事の本文にスキップ

13件のコメントを見る

(著) (編集)

公開:

この画像を大きなサイズで見る
Photo by:iStock
Advertisement

 ChatGPTやGeminiといった、文章を生み出す生成AI(人工知能)は、学術の世界にも確実に浸透しているようだ。

 最新の研究では、生命科学・医学分野の論文1500万件以上を分析し、AIが生成したと見られる独特な言葉づかいや文体が、すでに論文の一部に広まりつつあることが示された。

 その結果、2024年に発表された論文のうち少なくとも13.5%に、なんらかの形でAIを利用して執筆されれた痕跡が見られたという。

学術論文の執筆にAIはどれほど浸透しているのか?

 ChatGPTをはじめとする生成AIが登場してから、まだわずか数年しかたっていないが、ネットではAIによって生成されたコンテンツが爆発的に増加している。

 それは日常的なコンテンツのみならず、学術論文の世界においても変わらない。

 すべて人力で文章を書き上げるより、大なり小なりAIのサポートを受けながら執筆した方がずっと楽なのだから、それも当然のことだろう。

 だが、過剰なAIの利用は、高度な専門性が必要となる研究の正確性や信頼性を揺るがせるのではないかとの懸念の声も上がっている。

 はたして学術論文の執筆に、AIはどれほど普及しているのか? それを明らかにしようとしたのが、今回の調査である。

この画像を大きなサイズで見る
image credit:unsplash

AIが使う“クセのある言い回し”に注目

 従来、AIの使用を調べる方法としては、人間が書いた文章とAIが書いた文章を比べて違いを見つけるという手法が主流だった。

 しかしこの方法には、どのAIモデルを使ったか、どんな命令を与えたかによって結果が変わってしまうため、人間とAIの原稿を正確に区別することが難しかった。

 そこで今回ドイツ、テュービンゲン大学をはじめとする研究チームは、新型コロナの影響を分析した過去の研究にヒントを得て、こうした問題をあぶりだす方法を考案した。

 新型コロナの研究では、コロナ以前と以後の「超過死亡」の数を比較することで、この感染症が人々の死亡率に与えた影響を割り出していた。

 そこで今回の研究チームは超過死亡の代わりに、生成AI登場以前・以後に見られる論文中の「特定の単語の過剰利用」に注目した。

 つまりAIが多用する“クセのある言い回し”をチェックすることで、AIが利用された論文を見抜こうと考えたのだ。

この画像を大きなサイズで見る
Image created by DALL・E3

AIが好む言葉とは?

 分析に使われたのは、世界中の医学・生命科学分野の論文が登録されている巨大データベース「PubMed」に掲載された、2010年から2024年までの約1500万件の論文要旨である。

 研究チームはまず、「AIが登場する前」と「登場した後」とで、使われる単語にどんな違いがあるのかを調べた。その結果、ある特徴的な変化が浮かび上がった。

 生成AIが登場する前の論文では、「事実」や「研究内容」を端的に伝えるような、意味がはっきりした単語が多く使われていた。

 たとえば、「細胞」「増加する」「高い」「影響する」といった言葉である。

 これらの単語は「内容語」と呼ばれ、名詞・動詞・形容詞・副詞などのように、文章の中で具体的な意味を持つ言葉を指す。

 論文において「何が起きたのか」「どんな対象について語っているのか」といった、重要な情報そのものを伝える役割を担っている

 ところが、ChatGPTなどの生成AIが普及した後に発表された論文では、これらの内容語よりも、装飾的な魅せるスタイル重視の表現が目立つようになった。

 たとえば、「披露する(showcasing)」「極めて重要な(pivotal)」「取り組む(grappling)」などがその典型だという。

 これらの言葉は、AIが「それらしく聞こえる」文章を書くために好んで使うとされており、実際に多くの論文に登場するようになっている。

この画像を大きなサイズで見る
2024年に頻度が増加した語:(A)2024年における語の頻度と頻度比(r)を示す。破線は「過剰語」とそうでないものを区分するしきい値。また過剰語は「内容語(青)」と「文体語(オレンジ)」に分類されている。(B)縦軸を頻度差(δ)に変えたもの。/Credit: Science Advances (2025). DOI: 10.1126/sciadv.adt3813

論文の13.5%にAIの痕跡

 こうした言い回しの変化を分析した結果、2024年に発表された論文の少なくとも13.5%に、生成AIが関与したと見られる痕跡があることが明らかになった。

 また、生成AIの利用状況には分野ごとや国ごと、発表された学術誌ごとにもばらつきがあり、AIの浸透度や使い方の違いがあることもわかった。

 なお、今回の研究は生成AIを使った論文の「正確性」や「信頼性」がどう変化したかについては評価していない。

 だが、たった数年のうちに、生成AIによる執筆支援が学術の現場でも当たり前のものになりつつあることを、このデータは物語っている。 

 この研究は『Science Advances』(2025年7月9日付)に掲載された。

References: Science / Massive study detects AI fingerprints in millions of scientific papers

📌 広告の下にスタッフ厳選「あわせて読みたい」を掲載中

この記事へのコメント 13件

コメントを書く

  1. 論文までAIを使用し提出するのっておかしいぜ

    • -2
  2. 読書感想文で文集から丸パクリして賞状もらったワイ
    そっと閉じる

    • 評価
  3. AIの文章に慣れると今度は手動で書いててもAIが使いがちな単語とか使うようになりそう

    • +25
  4. 論文そのものはパクリ合いで俺の指導教授にはっきりと”似たような研究論文を見つけて文章構成をパクって、数字を入れ替えろ”と言われたぐらいだからAIそのものを否定する気はないが、その内容が正確なのかを確認しないといけないからAI以上の知識、分析能力がないと執筆する人間だけではなく査読する側が確認すらできない
    結局AIは便利に使えるがそれに頼りきれるものでもない

    • +10
  5. 何が問題なんだ?

    内容が間違っていなければ問題視する必要はない

    文章の下手な科学者がAIを使ってわかりやすい文章を書くこともある

    • +8
    1. 逆に聞くけどAIの痕跡やそれによる影響を調査すると何か問題あるのか?
      調査した結果悪影響ないとわかればむしろAIの有用性の証明になるんだから良いことじゃん。

      • +4
  6. 論文の内容が正確だったら、別にAIを使っても何も悪くないと思う。高度な推敲をしてくれるわけで、書く方も楽になって、読み手もわかりやすく感じられるからwin-winなのでは?

    • +4
  7. 履歴書の志望動機なんかのブラッシュアップにはけっこう使える。アメリカではみんなAIに書かせてて企業が対策してるとか。まあ不自然なくらい見栄えのする文章になるから逆にバレるかもな。

    • +6
  8. 自分の母語でなければ、翻訳にAI使うのくらいはもはや普通だと思う。もちろんその後自分で読み直して文意が変わっていないかなどはチェックし、更にネイティブチェックにかける。

    • +5
  9. 修飾と校正にAI使うだけなら問題ないだろうけど、そもそも論文の大多数が元よりアレな目的で作られてる訳で…
    ゴミの生成が人の手かAIかなんて意味も結果も変わらないから間違いなくAI生成論文で溢れる事になると思う
    AIで既存論理を再説明した論文を年1000本出してりゃどれか当たるかもしれんし

    • -4
  10. そのうち「AIがないと何にもできなーい」ってならなきゃいいけど。

    「スマホないと暇な時何したらいいのかわかんなーい」みたいな感じで。

    • 評価
  11. 「内容が間違ってないならAI使ってもいいのでは?」と言っている人が複数いるが、
    その「内容が間違ってないか」を判定するのがAIを使われると難しくなる、というのが問題なんだ。

    AIには幻覚(ハルシネーション)と言って、全く事実に基づいていない内容を一見もっともらしく説得力のある文章で出力してくるという特性がある。
    つまり人間がついた嘘を見破るより、AIがついた嘘を見破る方がコストがかかる場合があるということ。

    そのうえAIはそういう一見説得力のある長文をいくらでも大量生産できる。
    つまり見抜くのは労力がかかるのに作るのは低コストでできてしまうってこと。
    これは査読者が飽和攻撃に晒されるようなもんで、低品質論文を弾くのが追いつかない事態になりかねない。

    AI利用の広まりは、問題は多々あれどなんとか学術界の質と信頼を担保してきた査読というプロセスが一挙に崩壊するかもしれない大問題なんだ。

    • +2
    1. 論文を書いている者が、AIに文章を丸投げして、内容を読まずに即提出してるならそうかもしれませんね。ただ自分の論文をチェックせずに提出するなんてちょっと考え難いように思えますが。

      そもそも、ハルシネーションの話は「こういう実験をしたらこういう結果が出たから、こういう考察ができる」という論文の基本とはまた別の話じゃないでしょうか。ハルシネーションはこの流れを歪めるたぐいのものではないと思います。

      • -2

コメントを書く

0/400文字

書き込む前にコメントポリシーをご一読ください。

リニューアルについてのご意見はこちらのページで募集中!

サイエンス&テクノロジー

サイエンス&テクノロジーについての記事をすべて見る

  1. 記事一覧を読込中です。

知る

知るについての記事をすべて見る

  1. 記事一覧を読込中です。

最新記事

最新記事をすべて見る

  1. 記事一覧を読込中です。