カーネル法を使った強化学習のアルゴリズムの数値実験による検証(2)
1. はじめに 文献[1]で、UCLK(Upper-Confidence Linear Kernel reinforcement learning)という強化学習のアルゴリズムが提案されました。...
6 search resultsShowing 1~6 results
1. はじめに 文献[1]で、UCLK(Upper-Confidence Linear Kernel reinforcement learning)という強化学習のアルゴリズムが提案されました。...
1. はじめに 文献[1]で、UCLK(Upper-Confidence Linear Kernel reinforcement learning)という強化学習のアルゴリズムが提案されました。...
1. はじめに 2つの電源が接続された電力系統のシミュレータをマルチエージェント強化学習で制御するというタスクに取り組みました。 学習のアルゴリズムは、TF-Agents で実装しました。特に、...
はじめに 2022年4月に投稿した記事で、格子状に結合した振動系を制御対象として、 強化学習のアルゴリズムでコントローラを設計するタスクに取り組んだ結果を報告しました。自己回帰構造を持つネットワ...
はじめに これまで、 強化学習のアルゴリズムを使って コントローラを設計するときに、 コントローラを静的なネットワークで、 実装してきました。 すなわち、現時刻の観測値を入力し、操作量を出力する...
はじめに 機械学習のアルゴリズムを評価するときに、パラメーターの調整やネットワークの設計といった試行錯誤にかける時間が、最近、不足しているな、と感じています。もっともらしい結果、期待した結果、議...
6 search resultsShowing 1~6 results
Qiita is a knowledge sharing service for engineers.