機械学習でタンパク構造予測は、本当にできるのか?
こんにちわ、少しこれについて触れておきたいと思います。
去年の末頃、GoogleがAlphaFoldを発表しましたことは、記憶に新しいかと思います。
Google DeepMindのアプローチはAttention-basedのものです。システムは、タンパク質のフォールディング履歴に基づいて、可能性のあるタンパク質のフォールディング結果の予測をしていくものなります。
DeepMind以前にもタンパク質の構造予測は、かなり研究されています。
まず最初に思ったのが、既知以外の構造をどれだけ予測かできるかというお話しです。
アミノ酸配列がわかってる1.8億のタンパク質 のうち構造がわかってるのは17万個だけなのです。
つまり、残りの構造が短時間でわかると、薬の開発や病気の治療も加速されるというわけです。
それではAlphaFoldが最強で、もうこれだけでいいかと言われてる、そういうわけではありません。
データセットのAccuracy(casp)では、従来手法のほうが良い結果が出ています。
だだし!! 分析に要する時間がケタ違いとうことです。
AlphaFoldも単一のタンパク質 でなく、タンパク質の複合体の分析に今後は注力していくとのことです。
それにしてもすごい。
1.9億のパラメータの最適化しています。ちょっと我々の研究室では考えられない量です。
はじめまして!
こんにちわ、大学院2年の中野哲平です。
ここでは、普段の研究や興味ある分野の論文をメモがてらに残しています。
同じような興味がある人は、コメントしてもらえると嬉しいです。
普段の研究テーマは、
医療データの解析や機械学習分野への応用
がんデータにおける幅広なバイオインフォマティクス
をしております。
たまに書評もまとめております笑
CVについては、こちらをご覧ください!