この画像を大きなサイズで見る生物のゲノムには、その生物の身元だけでなく、生物の根本的な”垣根”すら超える生存環境の痕跡が残されているようだ。
カナダのコンピューター科学者と生物学者が、AIに極限環境微生物のゲノムを分類させてみたところ、「ドメイン」という分類学上の分け方とはまた違う、別の分け方をすることが明らかになったのだ。
それは極限環境微生物が生息している極端な熱環境に基づくもの。研究チームによれば、この発見は、環境的次元というまったく新しいゲノムの次元が見つかったような大発見であるそうだ。
DNAという言語で書かれた設計図、ゲノムを読み解く
「ゲノム」とは、生き物が生きるために必要な情報がすべて書かれた設計図のようなものだ。
そこにはDNAという言語によって、今地球上にいる生物すべての祖先となった「最初の共通祖先」から始まり、その生物にいたるまでの進化の道のりが記されている。
それを比較すれば、それぞれの生物の関係を明らかにして、進化の系統樹の位置付けを特定することができる。
カナダ、ウェスタン大学の生物学者キャサリン・A・ヒル准教授と、ウォータールー大学のコンピューター科学者リラ・カリ教授は、そうしたゲノムはDNA言語で書かれたテキストのようなものと説明する。
ゲノムはアデニン・シトシン・グアニン・チミン(A、C、G、T)の4つの配列で構成されるDNAによって書かれている。
これを文字や言語と見立てることができるのだ。たとえば”CAT”は、シトシン・アデニン・チミンの3文字で書かれた”DNA単語“だ。
1990年代、生物のゲノムから短いDNA配列を取り出し、そこで繰り返されているDNA単語を数えることで、その生物の身元を特定する方法が考案された。
ヒル准教授とカリ教授によれば、それは英語の本とフランス語の本を区別する作業にも似ているという。
それぞれの本から適当に1ページ抜き取りざっと目を通してみると、英語の本には”the”、フランス語の本には”les”という3文字の単語がたくさんあることに気づくだろう。どちらも定冠詞なので、どのページを調べてみても、おそらく結果は同じだ。
そしてゲノムのDNA言語にも同じことが言える。DNA配列の位置や長さに関わらず、その生物の身元を推測できるDNA単語の繰り返しがある。
これまで、こうした手がかりは、その生物の種・属・科・目・綱・門・界・ドメインを指し示していると考えられていた。ところが意外にも、ヒル准教授とカリ教授はそれ以外のヒントがあることを発見したのだ。
この画像を大きなサイズで見るAIがドメインを超えた分類を発見
2023年の研究で研究者たちは、今説明した方法によって「極限環境微生物」を調べている。
こうした微生物は、100度を超える暑さや、マイナス12度以下という寒さ、さらにはペーハーが極端なほど偏った環境など、とんでもないところで生きている。
研究チームは、AIに極限環境微生物700種のDNAデータを機械学習させ、そこにある共通点にもとづいてグループ分けするよう命じてみた。
実験前、極限環境微生物は「細菌」か「古細菌」に分類されるだろうと研究チームは予想していた。ところが驚いたことに、何度試しても、細菌と古細菌が混ざるグループができてしまうのだ。
一体なぜなのか? 分析から明らかになったのは、そのグループには極端な熱を好むという共通点があることだ。
生物の分類においてもっとも基本的なグループは「ドメイン」と呼ばれるもので、真核生物・細菌・古細菌の3つのドメインがある。
この画像を大きなサイズで見る「真核生物」は、膜で包まれた核を持つ生物だ。このドメインには動物(もちろん人間もだ)・植物・菌類・原生生物が含まれる。
一方、「細菌」と「古細菌」は、膜で包まれた核を持たない生物だ。それを持たない点では同じだが、細胞壁などの組成が大きく異なるため、細菌と古細菌は区別される。
こうした3つのドメインは、それぞれが大きく異なる。ヒル准教授とカリ教授によれば、たとえば細菌と古細菌の遺伝子は、ホッキョクグマ(真核生物)と大腸菌(細菌)くらい違う。
これほど違うのだから、AIは細菌を細菌グループに、古細菌を古細菌グループに分類するだろうと予想されるのも当然のことだ。
ところが実際にグループ分けの基準となったのは、極端な熱に適応しているかどうかだったのだ。それは、両者が生息する極端な温度環境は、それぞれのDNA言語に広範で系統的な変化を引き起こしたということだ。
この画像を大きなサイズで見るゲノムの新しい次元
ヒル准教授とカリ教授は、この発見について、よく知られている分類学的な次元のほか、さらに環境的次元というまったく新しいゲノムの次元を発見したようなものと述べている。
この予想外の発見は、地球の生命の進化を理解する手がかりになるだけでなく、宇宙空間で生きるために何が必要かを考えるうえでも大きなヒントになるという。
研究チームは現在、「デイノコッカス・ラジオデュランス(Deinococcus radiodurans)」のような放射線に耐性のある極限環境微生物のゲノムにも、それならでは環境の痕跡があるのか調べているところだ。
References:Extreme environments are coded into the genomes of the organisms that live there / written by hiroching / edited by / parumo
















カラパイアはかわいいもので緩和しつつこういう記事ぶっ込んでくるから好きなんだよ
以前、ゲノム配列の中の「アイソコア構造」というのが提唱され、恒温/変温などとの関連が議論された。(現在はかなり否定的な見方もある)
今回の話は、それと似たものを感じた
DNAレベルの収斂進化か水平伝播なのかな?
同じ環境に対応するにはどのレベルの生物でも共通点があるって事か
面白いね
よくわからないけど、ある極限環境に対応できるDNA配列は決まっていて、その環境に放り込まれたら種の垣根を超えて同じ配列を獲得したグループだけが生き残れる・・・ってコト!?
>>5
因果が逆かなぁ?
ある環境に耐え抜いた生物たちは、種の垣根を超えて同じような配列を獲得していた…かな?
さらにこれを逆説的に考えると、その配列部分を弄れば特定環境に強い生物を創れる可能性があるし、過去の地球ではどのような環境があったかもわかる…かもしれない
収斂進化で獲得したゲノム配列でグルーピングしているのなら、系統的に分けてるドメインとは大きく異なるのは当たり前のように思える、それとは違うのか?
>>6
今までの遺伝子情報を用いた系統解析は、比較する生物が共通して持つ遺伝子(酵素等のタンパク質)を比較して、その差異によって分類を行うというもので、その意味では熱に強いタンパク質は収斂進化で類似してもおかしくはない。
だけど、今回の研究はどうやら特定のタンパク質をコードしている遺伝子配列ではなく、ゲノムからランダムに切り出してきたDNA配列を比較解析してグルーピングしているということらしいので(具体的な解析方法については別論文参照となっていて読んでないけど)、ゲノム全体に普遍的に存在する特徴を比較しているということになる。
まぁ、遺伝子自体がほぼタンパク質を合成するための情報と考えると、そら全体の傾向として環境(熱、pH)の影響で似たような傾向が出てきてもおかしくはないわな、とも思うし、今回の研究の結果だけでは抽象的すぎるので、結局のところはより細かい部分に注目した研究をしていく必要があるだろうけど、適当に切り出してきたDNA断片を解析することである程度その生物がどのような環境に存在していたかわかるようになるのなら、それはそれで面白いことだと思う。
>>8
なるほどわかった
であるならば、この研究(とその手法)自体は古細菌と細菌がどうのと言う生物分類に関わることというより、極限環境に適応していた祖先の形質推定にとって重要なんだね。でも熱水噴出孔などの極限環境は生命の起源となった場所である可能性が高いし、そこを故郷とする微生物の進化を調べていけば、最終的にはドメインレベルの系統関係にも影響を与える研究かも知れない、ということなんだね?
コメント専門家すぎるだろ!カラパイアの読者層どうなってるの
バクテリアのゲノムはほとんどがタンパクコード遺伝子なので、熱環境に対応したコドン使用頻度、GC含量、リピート配列などで平行進化が起きるのは納得できそうな話ですね
以前流行ったSOM自己組織化解析とかと比べると、今回はだいぶスッキリ解釈できるクラスタリング結果が得られたということだろうけど、これはAI手法の進歩のおかげなのかね