14 search resultsShowing 1~14 results

Stocked
hasebirokou

@hasebirokou

Scion の紹介

はじめに 2025年7月現在、私が把握している限り最も性能が良い Optimizer である Scion を紹介します。 情報源 まず公式の実装へのリンクを記します 次に論文へのリンクを記します...

0
0
Comment0
hasebirokou

@hasebirokou

ReLU2を試してみた

はじめに 活性関数として $ReLU^2$ が良いらしいと聞いたので試してみました。 $ReLU^2$ は単純に ReLU を適用した後に二乗する処理になります。 斜め読みした論文は以下の通りで...

0
1
Comment0
hasebirokou

@hasebirokou

バイアス補正 EWA

はじめに 以前、以下の記事で固定学習率 + EWA の性能が良いと述べました。 実際に実行してみたところ、最終的な性能では ScheduleFree よりも良い結果になりました。しかしながら、序...

0
0
Comment0
hasebirokou

@hasebirokou

ADOPT で遊んでみた

はじめに 最近(2024年11月頃)発表された Adam 系の最適化機である ADOPT について色々遊んでみた結果です。 ADOPT とは ADOPT は最近(2024年11月頃)発表された ...

0
1
Comment0
hasebirokou

@hasebirokou

長期の勾配を利用する手法の備忘録

はじめに 最近、AdEMAMix という長期の勾配情報を利用する手法が提案されていました。 色々と違いはありますが、長期の勾配情報を利用する手法は過去にいくつか提案されているため、今後類似の手法...

0
0
Comment0

14 search resultsShowing 1~14 results

Qiita is a knowledge sharing service for engineers.

  1. You can follow users and tags
  2. You can stock useful information
  3. You can make edit suggestions for articles
Functions that can be used after logging in