Search result of “user:triwave33”

@triwave33

2023/12/17

Amazon Bedrockでモデルをカスタムして偉大なミュージシャンを降臨させた(?)話

LLMによる記事の要約このQiitaの記事では、Amazon Bedrockを使用して伝説のジャズミュージシャン、チャーリー・パーカー風の音楽を作成するプロセスについて説明しています。2023...

16

6

Comment0

@triwave33

2021/06/01

Deep Learningを使った音楽生成

書いたことニューラルネットワークを使ってこんなのを作るのに必要な基礎知識はじめにこの記事は、AWS builders.flashのブログ記事、「Deep Learningで音楽を作成するに...

64

55

Comment1

@triwave33

2019/08/14

XGBoost論文を丁寧に解説する(2): ShrinkageとSubsampling

はじめに第1回の記事で原著論文に沿ってXGBoostの基本事項を学習しました。（論文の2.2まで）第2回は論文読みをさらに進めていきます。特に勾配ブースティング法で用いられる学習率の概念を...

103

60

Comment1

@triwave33

2022/02/02

PyTorchでの分散学習時にはDistributedSamplerを指定することを忘れない！

PyTorch DDPでのマルチプロセス分散学習時のデータセットの指定方法について誤解していたので動作挙動を示したメモ。 TL;DR 分散学習時にDataLoaderを作成するとき、sample...

7

5

Comment0

@triwave33

2020/02/10

[入門] 結局Amazon SageMakerは学習の時に何をしているのか？

解説すること Amason SageMakerの一番最初の基礎事項のチュートリアル機械学習モデルの構築およびトレーニング、デプロイ with Amazon SageMaker 1行1行のコード...

59

34

Comment0

@triwave33

2019/08/08

XGBoost論文を丁寧に解説する(1)

はじめに勾配ブーストを用いた決定木(GBDT)によるクラス分類や回帰はデータ分析コンペでも非常によく使われています。その中でも2016年に出されたXGBoostはLightGBMと並びよく使...

834

680

Comment20

@triwave33

2019/12/30

scikit-learnのMultiLabelBinarizerで個々の購入データを表にまとめる

データ元個々の購入データ（変換前）各行はユーザID、各列はユーザの購入したアイテムを表している。列数は最も購入アイテムの多いユーザの購入数になる。そのため、空欄にはNaNが入っている。つく...

15

6

Comment0

@triwave33

2018/07/20

今さら聞けない強化学習（3）：行動価値関数とBellman方程式

はじめに前回、前々回と、強化学習を基礎から理解していくことにしました。今さら聞けない強化学習（1）：状態価値関数とBellman方程式今さら聞けない強化学習（2）：状態価値関数の実装　マ...

97

60

Comment4

@triwave33

2019/08/24

（修正）Juliaで反復数値計算をしたらPythonよりも圧倒的に速かった話←そうでもなかった話

注意この記事では最初、Juliaが劇的に速いという結論を出しましたが、検討の結果記事を修正しています。改変を加えて読みにくくなっていますが、この過程自体が速度の最適化とは何かを表していると思い...

91

67

Comment10

@triwave33

2019/04/16

Jetson Nanoの機械学習ベンチマークテスト

Jetson Nano Nvidiaより発売された、Jetsonファミリの中で最も小型のデバイス。上の写真は開発者ボード。 GPU搭載で、4GBのメモリ搭載。エッジ側でパワフルな処理ができる。...

14

9

Comment6

@triwave33

2018/02/18

今さら聞けないGAN（1）　基本構造の理解

なんとなく知っている気になっているけど。。。　ディープラーニング関連技術の中でも、GANに関するニュースは良く取り上げられていますね。警察と貨幣偽造者といったコンセプトは理解しやすく、学習した...

807

758

Comment1

@triwave33

2018/07/16

今さら聞けない強化学習（1）：状態価値関数とBellman方程式

はじめに　強化学習に対する参考書を読み進めて、深層強化学習のコードをgithubで落として一部改変して使ったりしています。しかし、肝心の理論に関するところが追いついていけません。　思うに、参...

375

334

Comment4

@triwave33

2018/09/02

今さら聞けない強化学習（10）: SarsaとQ学習の違い

今回やること TD法を用いた制御方法であるSarsaとQ学習の違いについて解説します。下記の記事を参考に致しました。コードはgithubにアップロードしています。【強化学習】SARSA、Q学...

146

106

Comment0

@triwave33

2018/12/13

今さら聞けない強化学習(11) 線形関数による価値関数近似

今回やったこと連続状態空間でのQ学習基底関数に同径分布関数を採用し、パラメータθとの線型結合で行動価値関数を近似パラメータ$\theta$の更新式を導出はじめに　これまでに、TD法を用...

36

41

Comment2

@triwave33

2018/08/19

今さら聞けない強化学習（9）: TD法の導出

　はじめに　これまでの記事で、動的計画法（DP法）およびモンテカルロ法（MC法）を用いて強化学習問題を解いて来ました。DP法とMC法の特徴は以下のようになります。手法価値関数の計算ブート...

71

69

Comment1

@triwave33

2018/08/04

今さら聞けない強化学習(8): モンテカルロ法でOpenAI GymのCartpoleを学習

はじめに前回の記事でモンテカルロ法による価値推定をおこないました。今さら聞けない強化学習（7）：モンテカルロ法で価値推定　今回は方策改善をおこない、OpenAi GymのCartPoleに...

21

17

Comment1

@triwave33

2018/07/28

今さら聞けない強化学習（6）：反復法による最適方策

はじめに　前回までに強化学習を行う上で基礎的な知識となる、状態価値（$V^\pi(s）$および行動価値（$Q^\pi(s,a)$）を定義し、反復法による状態価値関数の推定を行いました。今さら...

41

27

Comment0

@triwave33

2018/08/01

今さら聞けない強化学習（7）：モンテカルロ法で価値推定

はじめに　これまで6回に渡り、強化学習の基礎知識を説明してきました。ある決められた世界（格子世界）に対して、状態sをとること、もしくは状態sのときに行動aをとることの価値を算出しました。今さ...

61

46

Comment7

@triwave33

2018/07/22

今さら聞けない強化学習（4）：行動価値関数の実装

はじめに強化学習を解説する第4弾です。今さら聞けない強化学習（1）：状態価値関数とBellman方程式今さら聞けない強化学習（2）：状態価値関数の実装今さら聞けない強化学習（3）：行動価...

32

30

Comment0

@triwave33

2018/07/16

今さら聞けない強化学習（2）：状態価値関数の実装

はじめに前回の記事で状態価値関数$V^\pi$の導出をおこないました。今回はその際に説明した格子世界での状態価値関数をPython実装により計算してみたいと思います。コードは[github]...

60

50

Comment1

Search article