OpenAI-GymのCertPoleの強化学習をDDQN(Double Deep Q Netowrk)っぽいものをなでしこで実装したもの。学習終了の条件を設けていないので学習の様子を眺める用。DDQNではQ-Learningではテーブル参照で行っていたQ値の学習をDeep Learningで行う方法。CertpoleのGym機能自体は別のライブラリを取り込んで利用。
上記HTML↑をブログに貼り付けることでアプリを埋め込めます。