Search result of “user:Gimei_” - Qiita

2 search resultsShowing 1~2 results

2024/07/03

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments (MADDPG) 概要

はじめに．強化学習/MDP モデルを理解している人を対象に、MADDPG (https://arxiv.org/abs/1706.02275) の概要をまとめています。 MADDPG の立ち位...

1

0

Comment0

2024/07/02

Trust Region Policy Optimization (TRPO). ニッチな読み物

はじめに. 本記事は Trust Region Policy Optimization (TRPO) [cite:https://arxiv.org/abs/1502.05477] の Appe...

0

0

Comment0

2 search resultsShowing 1~2 results

Qiita is a knowledge sharing service for engineers.

You can follow users and tags
You can stock useful information
You can make edit suggestions for articles

Functions that can be used after logging in