OpenAI-GymのCertPoleの強化学習をDDQN(Double Deep Q Netowrk)っぽいものをなでしこで実装したもの。学習終了の条件を設けていないので学習の様子を眺める用。DDQNではQ-Learningではテーブル参照で行っていたQ値の学習をDeep Learningで行う方法。CertpoleのGym機能自体は別のライブラリを取り込んで利用。
上書き保存
表示ページ
→直前に実行(または一時保存)した内容を復元
なでしこバージョン: v
ログインするとファイルをアップロードできます。