14
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

深層強化学習ライブラリ machina

Last updated at Posted at 2019-03-19

深層強化学習ライブラリ machina

https://machina-rl.org/
https://github.com/DeepX-inc/machina

A Library for Real‑World
Deep Reinforcement Learning

新しい深層強化学習ライブラリがリリースされたようなので概要を訳してみました。

コンセプト

machina(mάkɪnə)は、実世界のタスクに深層強化学習 (DRL)を適用するために設計されたライブラリです。

DRL において、利用可能なアルゴリズムと方策の数が大幅に増加しています。実社会のタスクの開発は、(1)試行錯誤アプローチと、(2)環境、アルゴリズム、および方策が変わってしまう可能性のせいで困難です。そのため、DRLシステムの個々の構成要素を変更する機能は、開発者によって強く望まれています。

他のベンチマークライブラリと違って、machinaはDRLシステムの各構成要素の依存関係を分解することによってこのComposabilityの問題を解決します。

特徴

・強化学習のために設計されたComposability

Composabilityはコンピュータプログラミングにおける重要な特性であり、実行中にプログラムの構成要素を動的に切り替えることを可能にします。 machinaはこの原則を念頭に置いて構築・設計されており、システムおよびプログラム開発における高い柔軟性を持っています。

具体的には、RLポリシーは生成された軌跡を介して環境に働きかけ、一方の構成要素の交換を簡単にします。たとえば、machinaを使用すると、トレーニング段階でシミュレート環境と実際の環境を切り替えることができます。

混在環境の簡単な実装

エージェントは、異なる環境が混在する中で同時にまたは順次学習することが可能です。

複数のアルゴリズムを組み合わせるのに便利

エージェントは、さまざまな最先端のアルゴリズムを組み合わせて学習することができます。

ハイパーパラメータを動的に変更できる

ユーザーは、ハイパーパラメーターの自動チューニングのためのメタ最適化手法を容易に実装できます。

まとめると

環境、アルゴリズム、方策といった構成要素の分解やカスタマイズに優れているようです。

14
9
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
14
9

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?