Teppei's Diaryを簡単にご紹介

研究に関係のありそうなことを淡々とまとめています

機械学習でタンパク構造予測は、本当にできるのか?

news.mit.edu

 

こんにちわ、少しこれについて触れておきたいと思います。

 

去年の末頃、GoogleがAlphaFoldを発表しましたことは、記憶に新しいかと思います。

 

Google DeepMindのアプローチはAttention-basedのものです。システムは、タンパク質のフォールディング履歴に基づいて、可能性のあるタンパク質のフォールディング結果の予測をしていくものなります。

www.nature.com

 

DeepMind以前にもタンパク質の構造予測は、かなり研究されています。

 

f:id:teppei_nakano:20210208172233p:plain


 

まず最初に思ったのが、既知以外の構造をどれだけ予測かできるかというお話しです。

 

アミノ酸配列がわかってる1.8億のタンパク質 のうち構造がわかってるのは17万個だけなのです。

 

つまり、残りの構造が短時間でわかると、薬の開発や病気の治療も加速されるというわけです。

 

それではAlphaFoldが最強で、もうこれだけでいいかと言われてる、そういうわけではありません。

 

データセットのAccuracy(casp)では、従来手法のほうが良い結果が出ています。

 

だだし!! 分析に要する時間がケタ違いとうことです。

 

AlphaFoldも単一のタンパク質 でなく、タンパク質の複合体の分析に今後は注力していくとのことです。

それにしてもすごい。

 

1.9億のパラメータの最適化しています。ちょっと我々の研究室では考えられない量です。

 

 

はじめまして!

こんにちわ、大学院2年の中野哲平です。

 

ここでは、普段の研究や興味ある分野の論文をメモがてらに残しています。

同じような興味がある人は、コメントしてもらえると嬉しいです。

 

普段の研究テーマは、

医療データの解析や機械学習分野への応用

がんデータにおける幅広なバイオインフォマティクス

をしております。

 

たまに書評もまとめております笑

 

CVについては、こちらをご覧ください!

Teppei Nakano