Search result of “user:ymd_h”

12 search resultsShowing 1~12 results

Stocked

@ymd_h(山田)

2020/06/19

【強化学習】OpenAI Gym を Google Colab上で描画する方法 (2020.6版)

追記: 2022/1/2 この記事で紹介している方法のうちの1つのgym.wrappers.Monitorがgym=0.20.0で非推奨になりましたので、代替手法を調べて新しい記事を書きました。...

Comment0

@ymd_h(山田)

2021/01/17

【強化学習】Ape-X の高速な実装を簡単に！

内部実装の技術的な話は Zenn に記事を投稿しました。興味のある方はそちらをお読みください。 1. はじめに以前紹介記事も書いていますが、強化学習の経験再生 (Experience Rep...

Comment0

@ymd_h(山田)

2021/01/21

【強化学習】cpprb で Experience Replay を簡単に！

0. はじめに先日「【強化学習】Ape-X の高速な実装を簡単に！」を公開しましたが、今回はその基礎となる「Experience Replay (経験再生)」に関してより入門者向けの記事を書い...

Comment0

@ymd_h(山田)

2020/10/25

【祝】強化学習ライブラリTF2RL v1.0到達 ~CIやドキュメントサイトなど開発・利用環境の整備~

1. はじめに以前紹介した友人が開発しているTensorFlow 2.x 向け強化学習ライブラリTF2RLが、諸々整備してバージョン1.0に到達しました (いつの間にかスターも300超えていて...

Comment0

@ymd_h(山田)

2020/10/08

GitHubの公式のドキュメントのGitHub Docsがオープンソースになった

GitHub公式ブログ(英語)で、GitHubの公式ドキュメントサイトがオープンソースになったとアナウンスされていました。 2020年7月にリニューアルして立ち上げた docs.github.c...

Comment0

@ymd_h(山田)

2020/10/04

GitHub Code Scanning を使ってみた (YAMLの設定方法)

はじめに 2020年9月30日にGitHub Code Scanningが一般公開された。(Blog記事) 公式ドキュメントを読みつつ、実際に使ってみた内容を記事にまとめてみた。いつものように...

Comment0

@ymd_h(山田)

2020/08/26

TF2RL: TensorFlow2.x 向け強化学習ライブラリ

友人の @ohtake_i が開発している強化学習向けのライブラリTF2RLの紹介記事。私もちょこちょこお手伝い (issue対応・PR作成) させてもらってます。（拙作のリプレイバッファラ...

Comment0

@ymd_h(山田)

2020/08/23

DeepMind製強化学習フレームワーク Acme

以前の記事で少し触れたDeepMind製の強化学習向けフレームワーク Acme (a research framework for reinforcement learning) についての紹介...

Comment0

@ymd_h(山田)

2020/04/05

【強化学習】自作ライブラリでDQN

TL;DR 自作のReplay Bufferライブラリcpprb を使って、DQNを実装してみた。高い自由度と効率性を兼ね備えている（つもりな）のでおすすめ。 1. 背景と経緯 Open AI...

Comment0

@ymd_h(山田)

2020/08/03

[失敗談] ndarray に + 1 したら、意図せず dtype が変わってしまった

前提拙作の強化学習用ライブラリcpprbの開発の中で遭遇したバグ (issue) 強化学習のExperience Replay用にデータを一時保存しておくためのライブラリであり、そのデータの型...

Comment0

@ymd_h(山田)

2020/06/26

【強化学習】爆誕: DeepMind製 Experience Replay (経験再生)フレームワーク Reverb

英語で書いたブログ記事の日本語焼き直し。 1. はじめに 5月26日にDeepMindが強化学習における Experience Replay (経験再生) のためのフレームワークとして、Reve...

Comment0

@ymd_h(山田)

2020/06/29

【強化学習】DeepMind製Experience ReplayライブラリReverbの使い方調査【クライアント編】

英語で投稿したブログ記事の日本語焼き直し 1. はじめに前回に引き続き、DeepMind製のExperience ReplayライブラリのReberbについて。今回は、データの入出力操作を指...

Comment0

12 search resultsShowing 1~12 results

Qiita is a knowledge sharing service for engineers.

You can follow users and tags
You can stock useful information
You can make edit suggestions for articles

Functions that can be used after logging in

Search article