この画像を大きなサイズで見る生物の進化には長い時間がかかるといわれている。だがAIが、約5億年分の進化をシミュレーションし、全く新しい蛍光タンパク質を生み出した。その名は「esmGFP(イーエスエム・ジーエフピー)」。
サンゴイソギンチャクが持つ蛍光タンパク質に近いが、4割の部分はAIが27億以上のタンパク質データを学習して、そこから独自に考案したものだ。
タンパク質を設計するAIモデル「ESM3」は、今後新薬の開発などに役立つ可能性があると期待されている。
生命の基本的な構成要素「タンパク質」
「タンパク質」は生命の基本的な構成要素の1つで、生物の体を構成し、生命活動を支える重要な分子だ。
筋肉や皮膚、髪の毛だけでなく、体内で化学反応を助ける酵素や病気と戦う抗体などもタンパク質の一種だ。
タンパク質はアミノ酸と呼ばれる小さな部品がつながってできており、その並び方によって異なる働きを持つ。
一口にタンパク質と言っても、たった1つの化合物ではなく、じつにバラエティ豊かだ。
そもそも生物のタンパク質は、遺伝子の情報に基づいて合成される「アミノ酸」が鎖のようにつながってできている。だが、その配列はタンパク質によって違うし、タンパク質の折りたたまれ方も違う。
こうしたアミノ酸の配列や形状の違いによって、多種多様なタンパク質の機能が生まれてくる。
この画像を大きなサイズで見るAIが進化のプロセスを再現、新たなタンパク質を生み出す
米国ニューヨーク州に拠点を置く「EvolutionaryScale社」の研究チームが開発したAIモデル「ESM3」は、こうした構造を理解するために膨大なタンパク質のデータで学習している。
そのデータは、自然界に存在する27億8千万個のタンパク質の設計図で、アミノ酸配列・構造・機能といった主な特性に関する情報を含んだものだ。
そのうえで、タンパク質の設計図の一部を適当に隠し、この空欄をESM3に示し、データから学習したタンパク質のルールを踏まえて、穴埋めさせる実験を行った。
これは学校の授業でお馴染みの穴埋め問題のようなものだ。「〇きるべきか、〇ぬべきか、それが〇〇だ」…この文の〇の部分を意味が通じるように埋めよといった問題を、あなたもやったことがあるだろう。AIは同じことをタンパク質のデータでやったのだ。
その結果、自然界に存在しない「esmGFP」と命名された未知の蛍光タンパク質の設計図が出来上がったのだ。
それはサンゴイソギンチャクが持つものに”比較的”近いが、同じなのは58%だけだ。そのほかの部分は、96の遺伝子変異が必要になるきわめて独自の構造だ。
研究チームによるなら、もしも自然の進化に任せるとしたら、これができるまでに5億年はかかると推測されるという。
この画像を大きなサイズで見る生命進化の外の領域で未知のタンパク質を探る
こうしたESM3のやり方は、自然の進化のこれまでの道筋をそのまま辿るわけではない。むしろ、進化が取り得るあらゆる可能性を探索し、まだ出現していないタンパク質を探すのだ。
EvolutionaryScale社の共同創設者アレックス・リヴス氏は、Live Scienceの取材に対し次のように述べている。
ESM3は基本的な生物学を学習し、進化が探ってこなかった領域の外できちんと機能するタンパク質を生成します(アレックス・リヴス氏)
ESM3が示したこの強力なタンパク質設計能力は、新薬の開発など、タンパク質工学の進化を強くサポートしてくれると期待されている。
現在でも、さまざまな用途に合わせて自然のタンパク質が改良されることがある。
例えば、オワンクラゲが持つ緑色蛍光タンパク質の遺伝子情報を、ほかのDNA配列の端っこにくっつけておく。こうすると、そこから作られるタンパク質が光るようになるので、その振る舞いを簡単に観察できるようになる。
5億年の進化をあっという間にシミュレートするAIによって、今後どのようなタンパク質が開発されるのだろうか? そしてそれが生物に果たす役割とは? それは今後のお楽しみだ。
この研究は『Science』(2025年1月16日付)に掲載された。
追記:(2025/02/02)タイトルを一部訂正しました。
References: AI Simulates Half a Billion Years of Evolution to Create a Glowing Protein That Nature Never Could / New glowing molecule, invented by AI, would have taken 500 million years to evolve in nature, scientists say | Live Science / AI simulates 500 million years of evolution to discover artificial fluorescent protein | Science | EL PAÍS English














申しわけないけど、イヤな予感しかしないが……
低分子の「猛毒」が小麦粉に見えちゃうような毒がある世界だし。
って、AIで(高分子に限らず)毒性物質探索でもうかなり恐ろしい結果出てたよね。
あらゆる科学研究は軍事や悪意にも利用されるジレンマ
でもそれ言い出したら何もできんのでチェック怠らず進めるしかないという科学倫理重要性の定期
あらゆる研究には光と闇がある
これは…うん、光ってるな!
触媒、酵素、タンパク質の持つ機能はまだまだ可能性を秘めてるね、生物進化の時間をAIで飛び越えるのはロマンがある
どうせ善も悪も使う側の問題なのだから、やってしまえって思う
4種類で手牌が27億個ある麻雀で役を作るようなもんだな
実際に機能するか実物で確かめられたのだろうか?
タンパク質が足りないよ♪ タンパク質が足りないよ♪
タンパク質形成はぶっちゃけどうでもいい
ゲノム構造が成立しないと生命になり得ない一代限りの存在
この無茶苦茶に複雑な構造を最初期に組み上がる確率なんて計算するまでもない
それが隕石からの種子だとしてもやはりその起源はの疑問は続く
たぶん生命発生の謎はこの宇宙成立の理由と関わってると思う
実験的には、蛍光タンパク質の分子量(=塩基対)は小さいほど優れていると言っていい