大富豪AIにおけるビット演算の利用 後編
ビット演算テクニックAdvent Calendar 2016 投稿です。 トランプゲームの大富豪におけるビット演算の利用について、前編に引き続き書いていきます。 大富豪AIにおけるビット演算の利...
11 search resultsShowing 1~11 results
You need to log-in
ビット演算テクニックAdvent Calendar 2016 投稿です。 トランプゲームの大富豪におけるビット演算の利用について、前編に引き続き書いていきます。 大富豪AIにおけるビット演算の利...
ビット演算テクニックAdvent Calendar 2016 投稿です。 トランプゲームの大富豪におけるビット演算の利用について、 私がこれまでに行ってきたことを書いてみたいと思います。 なお全...
問題設定 強化学習の方策の急峻化を防ぐため、過去のエピソード内の方策(挙動方策)とのカルバック・ライブラー(KL)情報量ロスを加え、学習をゆっくり進める。 このとき方策全体ではなく選んだ行動の選...
※このエントリには漫画「嘘喰い」に登場するゲームのルールの記載あるのでご注意ください。 先日「嘘喰い」を最後まで読みまして、最終章の「ハンカチ落とし」ゲームについては単純化すれば最適な戦略(ナッ...
巨大なニューラルネットを学習するZeRO-Offloadと、それを含むDeepSpeedライブラリが話題だったので使ってみました。(2021/1/24時点) 本家ドキュメント https://w...
前書き 強化学習を使ってみよう!という方がオンポリシーのアルゴリズムに頼って、良い結果が出ずに終わっているのを見かけるので、オフポリシー学習もイイぞ!と伝えたいと思いました。 (2021/6/2...
Coq、もっと言えば数学的にパズルやゲーム等を扱う上で無限反復の難しさがあります。 Coqでは再帰関数として停止性が明らかなものしか認められないという制限があるためです。1 しかし一方で現実で扱...
30を言ったら負け みなさんは小さい頃、「30を言ったら負け」ゲームで遊んだことがあるでしょうか。 正直このゲームに名前が付いていた記憶は無いのですが、以下のようなゲームです。 二人で先攻後攻を...
まず結論から 分位点の計算は 簡単な方法 クイックセレクトのライブラリを使う 同じデータから何度も行う場合は予めソートする データの貯め方も自由なら二分探索木がスケール可能 速度、メモリ至上主義...
こちらの記事でアニーリングでゲーム木を解けることがわかったので、実際に量子アニーリングマシンで○×ゲーム(三目並べ、Tic-Tac-Toe)を解くことを目標に、まずBlueqatのシミュレータで...
D-Waveなどの量子アニーリングマシンでゲーム木を解くことができるのか、アニーリングのシミュレータで確かめてみます。 and演算とor演算 ゲーム木の2値バージョンであるand/or木を解くた...
11 search resultsShowing 1~11 results
Qiita is a knowledge sharing service for engineers.