Teppei's Diaryを簡単にご紹介

研究に関係のありそうなことを淡々とまとめています

強化学習を応用した治療戦略

強化学習を医療に利用しようとする研究を2020年より、よく見かけます。

 

そんな中でもDavid SontagさんのLabは多くの面白い研究を生み出してるので、この度ご紹介します。

arxiv.org

 

強化学習を臨床的意思決定を有意に改善する可能性があるとして研究を始めたそうです。

 

しかし、ご存知のように観察データからRLを介して学習された治療方針は、研究デザインの微妙な選択に敏感だと。

 

彼らは、モデルベースのRL研究のための反復的な設計プロセスに臨床家を参加させるための簡単なアプローチである軌跡検査を強調している。モデルが予想外に積極的な治療法を推奨したり、その推奨から予想外にポジティブな結果が得られると予想している場所を特定する。次に、学習したモデルと方針を用いて、実際の病院のコースと並行してシミュレーションされた臨床の患者の動態を調べる。

 

このアプローチを敗血症管理のためのRLに関する最近の研究に適用することで、退院に向けたモデルのバイアス、サンプルサイズが小さいことと関連している可能性のある高用量のバソプレッサーを好む傾向、バソプレッサーを離脱させずに退院することへの臨床的にありえない期待を明らかにした。

 

彼らのの方法で明らかになった問題点を検出し、それに対処することを繰り返していくことで、RLポリシーが、配備の信頼性を高める結果となることを期待している。