
50年謎だったタンパク質をAIが解明 image by:DeepMind
タンパク質の構造と振る舞いは、専門家を50年来悩ませてきた問題だった。そんな難問をAIが手際よく解明してしまったそうだ。「タンパク質の折りたたみ(タンパク質フォールディング)」と呼ばれる問題に挑戦したのは、チェスや囲碁で世界をあっと言わせたイギリスの人工知能企業「DeepMind」だ。その最新のAIシステム「AlphaFold」が、この問題における飛躍的進歩をもたらした。
タンパク質のフォールディング問題とは?
私たち生物の体の中に無数にあるタンパク質は、いわばナノマシンのような存在で、生命が生きるために欠かすことができない物質だ。血液に酸素を運ばせたり、目に光を感知させたり、筋肉を作ったりと、ありとあらゆる生物学的プロセスに関与している。まるでビーズのようなアミノ酸が連なった糸を想像してもらいたい。これがタンパク質の基本的な構造だ。だがアミノ酸は20種類あり、それらが相互に作用することで折りたたまれ、複雑な3次元構造になっている。そしてこの3次元構造の違いによって、タンパク質の機能も違ってくる。
アミノ酸の相互作用は複雑怪奇だ。タンパク質には2億種以上あることが分かっているが、詳しく3次元構造が判明しているのはほんの一部だけだ。もしアミノ酸の相互作用を理解して、その配列から3次元構造を予測することができれば、タンパク質の解明は一気に進む。
これが世界中の科学者が取り組みながら、長年解決することができなかった「タンパク質の折りたたみ(フォールディング)問題」だ。

フォールディング前とフォールディング後のタンパク質 image by:public domain/wikimedia
誤差が原子1つ分という超精密予測
AlphaFoldはタンパク質の「空間グラフ」を解釈し、計算することができるAIだ。これに過去に科学者が苦労した集めた17万のタンパク質構造データを与えて学習させた結果、アミノ酸の配列からタンパク質の3次元構造を正確に予測できるようになったという。予測の誤差は平均1.6オングストローム――すなわち原子1つ分と超精密な予測だ。
タンパク質の構造予測の精度は、一般に「CASP(Critical Assessment of Techniques for Protein Structure Prediction))」という方法によって評価される。そしてAlphaFoldのCASPスコアは92.4。これは実験によって得られた結果と概ね同等とみなしていい予測精度であるという。

さまざまな分野でのブレークスルーに期待
ここから想像される未来は明るい。さまざまな応用が考えられ、たとえばこれまで治せなかった病気の原因をさっと特定し、治療薬を作ることができるようになる。あるいはプラスチックを分解する酵素や大気中に含まれる二酸化炭素を吸着するような酵素すら人工的に作れる可能性があるそうだ。
この成果はまだきちんとした形で発表されておらず、今の時点(20年12月2日)ではその要旨を確認できるのみだ。それでもタンパク質を活用しているさまざまな分野でのブレークスルーを期待したい。
References:AlphaFold: a solution to a 50-year-old grand challenge in biology | DeepMind/ written by hiroching / edited by parumo
あわせて読みたい





コメント
1. 匿名処理班
こう言うデータの集積と解析が鍵になる分野は、AIの方が向いてるんだろうなぁ
2. 匿名処理班
なんだかよくわからんがとにかくすごいということがわかった
3. 匿名処理班
文を読んでも図を見ても何が何やらさっぱりわからん
4. 匿名処理班
これは素晴らしい。
以前、理研でデザインドラックの説明を受けたとき、蛋白質の3D構造の解明が「受容体に薬が入るかとどうか」だの鍵だといってたのを思い出す。
あるいはプリオン分子の崩れの修正にも繋がるかもしれない。
更に研究が進むことを望む。
あと献金したいなコレ。
5. 匿名処理班
alphafold2やんけ
ver表記ちゃんとしてクレメンス
6. 匿名処理班
人体全てを、とかも未来のコンピュータなら出来るんかな
7. 匿名処理班
タンパク質構造のシミュレーションが容易になるのかなあ、医学的に大きな躍進だと思う。
8. 匿名処理班
まぁ、俺の予想した通りだったけどなー(棒読み)
9. 匿名処理班
※3
今までアミノ酸配列を基に実際のたんぱく質を作ってX線とかでそくていしなきゃ構造がわからなかったんだけど、アミノ酸配列がわかれば計算でその構造が出せるようになったということだと思う。有益なたんぱく質を作るための総当たりに使えるんじゃないかな。
10. 匿名処理班
タンパク質って変形したり壊れやすかったりするからこういうの難しいと思ってたけど、こりゃすごい!
11. 匿名処理班
これはすごいことだよ
同じ化学式でも構造が違うと別の特性が備わる無機質のように、タンパク質は立体構造によって多様な能力を持つ
今後、人工のタンパク質が合成されてナノマシンのように様々なミクロの世界で活躍する場が増えるんだろうな
それと同様に、悪用する手段も考えられるんだろう(例えば瞬時に何かを溶かしてしまうタンパク質とか)
12. 匿名処理班
どういうこっちゃ?
13. 匿名処理班
※4
3D構造の解明が「受容体に薬が入るかどうかの鍵」だといってたのを思い出す。
だな
いつもスマナイ。
14. 匿名処理班
「屁のつっぱりはいらんですよ」と同じぐらい
言葉の意味はわからんが
ものすごいという雰囲気は伝わった
15. 匿名処理班
プラスチックから肉作っちゃう時代が来たりするんだろうか
16. たまご
回のように実験によって得られた答えじゃなくてもほぼ確実な答えさえ出れば逆算して証明できたり、その結果を用いてさらに研究の幅が増えますよね。
今の時代AIをうまく使う能力も求められるわけですか。
17. 匿名処理班
発現しているDNAの塩基配列(コドン)からアミノ酸配列がわかる。アミノ酸は2つ以上の結合でペプチド、機能と3次元構造を持てばタンパク質と一般的に名称が変わる。
膨大な数のアミノ酸が結合したタンパク質の解析はDNA側から解析していく方法と、生体内のタンパク質自体を分離精製して酵素分解し、断片(フラグメント)解析していく方法がある。
かつてそのような研究をしてました。どちらもやって、仮説を立証するのですが、コツコツやって、途方も無い労力と時間、資金を必要とします。
DNA側からのアプローチで3次元構造の見通しがつくことだけでも凄いことです。
18. 匿名処理班
ざっくり言えば、生物の最も小さい部品(タンパク質)
の形が、"実験しなくても"分かるようになったということ
極端に言えば、実験しなくても新しい薬を作り出せる、ということなのかな?
(超雑な理解)
19. 匿名処理班
>これに過去に科学者が苦労した集めた17万のタンパク質構造データを与えて学習させた結果、アミノ酸の配列からタンパク質の3次元構造を正確に予測できるようになったという。
同じ様に、少しは解っているが大部分は未解明の科学分野に応用できないかな?
たとえば脳の神経回路網の地図である脳のコネクトームなんかも解明された部分を学習データにAIを鍛えて残りの未解明部分を予測させることはできないものか?
100%の精度で解明できなくても、ある程度の精度で解明できれば脳科学や更に優れたAI構築に向けて大きな飛躍になるんだけどな。
20. 匿名処理班
歴史の転換点
21. 匿名処理班
過去記事だとゲーマーが頑張って解いていたよね
またAIが勝ってしまったか
22. 匿名処理班
※21
正直人間に勝てる要素ないよ
あるとしたらAIが知らないジャンルか、将棋のプロみたいなひらめき系
それすら抜かれつつあるけど・・・
AIは一台じゃなくて100台でも1000台でもネットワーク経由して並列して学習できるしもう人間のできる事超えつつある。
まだ堂々と表には出てないけどgoogleとアメリカ軍が似たようなシステム構築してる。
中国や各国も出てないだけで同じような事やろうとしてると思う。
23. 匿名処理班
今やAIは
神のような・・・いや、神そのもののトレーダーになっているという事だ
24. 匿名処理班
タンパク質の立体構造を知る方法として一番有効なのは単結晶X線回折だけど
結晶化するのが大変だし測定も放射光が使える施設(素粒子研究とかの加速器がある所)
じゃないといけないからかなり大変。
25. 匿名処理班
※18
二酸化炭素からぶどう糖も石油も作ろう
たぶんできるよね
26. 匿名処理班
すごいなぁ。人間はついに神様を作ったのね。
27. 匿名処理班
アルファ碁を思い出すとなつかしい。アルファシリーズが活躍したと聞くと不思議とうれしい。