タンパク質のフォールディング問題も解決! 「バイオ研究のすべてが変わる研究」学者が全期待を寄せるAIシステムとは?

 画期的なAIの開発によってこれから生物学が一世代に一度の劇的な進歩を遂げることになるという。これまでほとんど知られていなかったタンパク質の3次元構造の理解が一挙に進むというのだ。


■「タンパク質のフォールディング問題」の解決策が登場

 遺伝子治療の可能性が広がっている昨今ではあるが、それでもほとんどの治療法は我々の肉体、つまりはタンパク質に対して行われる。現実の肉体を構成しているタンパク質だが、実は我々はこのタンパク質のことを驚くほど知らないのだ。

 “ホログラム”は2次元の情報から浮かび上がらせた3次元の立体像だが、我々の身体を構成するタンパク質もまた元は単なる鎖状の情報である。

 タンパク質はさまざまなアミノ酸が結合した構成物であり、アミノ酸配列がタンパク質の立体構造(生物機能)を決定している。鎖状のアミノ酸の情報から3次元構造が形成されるのだが、タンパク質が持つ立体構造に至るまでの「フォールディング(折りたたみ)」の過程はこれまでほとんどわかっておらず、これは「タンパク質のフォールディング問題」と呼ばれている。つまりアミノ酸の情報からどのようなタンパク質が生成されるのか、まるで“ブラックボックス”であるかのようにほとんどわかっていないのだ。

 1970年代に、ノーベル化学賞を受賞した生化学者のクリスチャン・アンフィンセン博士は、アミノ酸の1次元シーケンスからタンパク質の3D構造を計算で予測できると主張したのだが、問題は時間と労力である。どのようなタンパク質になるのかについての可能性は天文学的な数に及び、それを1つ1つしらみつぶしに検証するのは一生かかっても不可能である。

 このように手の着けようのなかったタンパク質のフォールディング問題なのだが、驚くべきことに昨年になって一筋の光明が見えてきたのだ。それはAIを活用する方法だ。

 2020年12月、グーグル傘下の「DeepMind」が機械学習を用いてタンパク質を構成するアミノ酸の配列からその3D構造を高速かつ高精度で予測できる「AlphaFold2」(アルファフォールド2)という画期的なAIシステムを発表した。

 オンラインのコンペティションの中で発表されたAlphaFold2だったが、他のモデルはまったく太刀打ちできない性能を見せ競争相手を一掃したのである。

「Singularity University」の記事より

■AIシステムによるバイオ研究の新時代

 しかしこの発表後、DeepMindのチームはAlphaFold2の詳細なメカニズムを明らかにしなかったことで、米ワシントン大学のミンギヨン・ベイ博士は同様のAIシステムである「RoseTTAFold」(ロゼッタフォールド)を開発して無料で公開し、先日には科学誌「Science」でその詳しい仕様を解説したのである。

 ディープラーニング(深層学習)を用いたRoseTTAFoldは、3つのレベルのパターンを同時に処理し、テストの結果はAlphaFold2ほど正確ではなかったものの、必要な時間とエネルギーははるかに少なかったという。単純タンパク質の場合、アルゴリズムはゲーミングPCを使用して約10分で3D構造を浮かび上がらせることができたのだ。

 またRoseTTAFoldは免疫分子の構造がどのようにその標的に固定されるかをアルゴリズムを使って予測することができ、以前はアクセスできなかった生物学的プロセス(免疫系、脳卒中、がん、脳機能)を操作するための扉もまた開かれたのである。

タンパク質のフォールディング問題も解決! 「バイオ研究のすべてが変わる研究」学者が全期待を寄せるAIシステムとは?のページです。などの最新ニュースは知的好奇心を刺激するニュースを配信するTOCANAで

トカナ TOCANA公式チャンネル