強化学習モデル地図 簡易コード 修論で書いたコードの超簡易版 utils.py 対数尤度計算・二重中心化に使用する関数 samplecode.ipynb 準備からモデル地図生成までの一連の流れをnotebookでおためし colabなら特に何かいじらないでも最後まで動く…はず。 samplemodel samplecodeで使用する強化学習モデル。全70モデル(アルゴリズム7種×ステップ数10) 環境(Environment) MuJoCo HalfCheetah-v5