Search result of “user:YuriCat”

11 search resultsShowing 1~11 results

Stocked

@YuriCat(Katsuki Ohto)

2016/12/21

大富豪AIにおけるビット演算の利用後編

ビット演算テクニックAdvent Calendar 2016 投稿です。トランプゲームの大富豪におけるビット演算の利用について、前編に引き続き書いていきます。大富豪AIにおけるビット演算の利...

Comment0

@YuriCat(Katsuki Ohto)

2016/12/09

大富豪AIにおけるビット演算の利用前編

ビット演算テクニックAdvent Calendar 2016 投稿です。トランプゲームの大富豪におけるビット演算の利用について、私がこれまでに行ってきたことを書いてみたいと思います。なお全...

Comment0

@YuriCat(Katsuki Ohto)

2022/12/04

選択バイアスのない1-action KL正則化

問題設定強化学習の方策の急峻化を防ぐため、過去のエピソード内の方策（挙動方策）とのカルバック・ライブラー(KL)情報量ロスを加え、学習をゆっくり進める。このとき方策全体ではなく選んだ行動の選...

ReinforcementLearning

Comment0

@YuriCat(Katsuki Ohto)

2019/08/05

「嘘喰い」のハンカチ落とし（1回限り）の最適戦略を求める

※このエントリには漫画「嘘喰い」に登場するゲームのルールの記載あるのでご注意ください。先日「嘘喰い」を最後まで読みまして、最終章の「ハンカチ落とし」ゲームについては単純化すれば最適な戦略（ナッ...

Comment0

@YuriCat(Katsuki Ohto)

2021/01/23

DeepSpeedのインストール&ZeRO-Offload利用法

巨大なニューラルネットを学習するZeRO-Offloadと、それを含むDeepSpeedライブラリが話題だったので使ってみました。(2021/1/24時点) 本家ドキュメント https://w...

Comment0

@YuriCat(Katsuki Ohto)

2020/12/09

オフポリシー強化学習のすゝめ

前書き強化学習を使ってみよう！という方がオンポリシーのアルゴリズムに頼って、良い結果が出ずに終わっているのを見かけるので、オフポリシー学習もイイぞ！と伝えたいと思いました。（2021/6/2...

Comment11

@YuriCat(Katsuki Ohto)

2020/10/02

無限反復を含むパズル/ゲームをCoqで定義する

Coq、もっと言えば数学的にパズルやゲーム等を扱う上で無限反復の難しさがあります。 Coqでは再帰関数として停止性が明らかなものしか認められないという制限があるためです。1 しかし一方で現実で扱...

Comment0

@YuriCat(Katsuki Ohto)

2020/09/27

30を言ったら負けゲームの勝敗をCoqで証明

30を言ったら負けみなさんは小さい頃、「30を言ったら負け」ゲームで遊んだことがあるでしょうか。正直このゲームに名前が付いていた記憶は無いのですが、以下のようなゲームです。二人で先攻後攻を...

Comment0

@YuriCat(Katsuki Ohto)

2019/01/07

分位点の計算クイックセレクト/二分探索木/P^2アルゴリズム(近似)

まず結論から分位点の計算は簡単な方法クイックセレクトのライブラリを使う同じデータから何度も行う場合は予めソートするデータの貯め方も自由なら二分探索木がスケール可能速度、メモリ至上主義...

Comment0

@YuriCat(Katsuki Ohto)

2019/03/01

(量子)アニーリングで○×ゲームの完全解析

こちらの記事でアニーリングでゲーム木を解けることがわかったので、実際に量子アニーリングマシンで○×ゲーム（三目並べ、Tic-Tac-Toe）を解くことを目標に、まずBlueqatのシミュレータで...

Comment0

@YuriCat(Katsuki Ohto)

2019/03/01

(量子)アニーリングでゲーム木(and/or木)探索

D-Waveなどの量子アニーリングマシンでゲーム木を解くことができるのか、アニーリングのシミュレータで確かめてみます。 and演算とor演算ゲーム木の2値バージョンであるand/or木を解くた...

Comment0

11 search resultsShowing 1~11 results

Qiita is a knowledge sharing service for engineers.

You can follow users and tags
You can stock useful information
You can make edit suggestions for articles

Functions that can be used after logging in

Search article