6GiBVRAMで4300万パラメータのモデルをバッチサイズ64で学習する
はじめは私も無理だろって思ってました。意味があるのかは知りません。 そもそもバッチサイズ=1にして勾配を累積させればいいんじゃね? 駄目です。バッチサイズ=1でも余裕でOOMです。 Gradie...
9 search resultsShowing 1~9 results
You need to log-in
はじめは私も無理だろって思ってました。意味があるのかは知りません。 そもそもバッチサイズ=1にして勾配を累積させればいいんじゃね? 駄目です。バッチサイズ=1でも余裕でOOMです。 Gradie...
前回までのあらすじ これを書いたときはBlenderが3.xだったが、4.xになってから動かなくなったし、昨日の更新もしたいなと思ったので振り返りながらつらつら書いていきます。 変更点 Alph...
どういうことか 以下のようなドキュメントの時 { aaa: 0, xxx: 12, nnn: 42, } それぞれのフィールドを1づつ加算することのみを許可したい。 どうやるか ルールに、どのフ...
めちゃくちゃ沼った上に、解決方法がかなり複雑なので備忘録も兼ねて書いておきます。 tl;dr npm i git+https://github.com/ajiken4610/vite-plugi...
どうにかして変数1個かつ1文で素因数分解をしたので、記録として、あと誰かの参考になれば、と思い、残しておきます。 レギュレーション 入力はprompt()、出力はalert()を用いること。(J...
私がまだWeb初心者で(今でも実戦経験はありませんが)、Vueさえ知らない頃はよくjQueryのお世話になりました。 しかし、今ではjQueryを使うことは一切ありません。 なぜなら、jQuer...
Blenderはゲームエンジンみたいなのに乗せるのに向いてない気がしたので、とりあえず作ってみた。 とりあえず関数を書いてみる 引数は、マテリアル名、オブジェクト名、テクスチャのサイズの3つでよ...
参考になれば幸い。 GPT-3が流行ってるのにGPT-2やるの時代遅れとか言わない ファインチューニング 友達がたくさん入ってるグループがあって、そのグループっぽい会話を生成したかったのでファイ...
レーベンシュタイン距離ではだめなのか 文字列の類似度を計算するアルゴリズムの一つとして、レーベンシュタイン距離がありますが、計算量が O(mn) であるため、文字数が増えると計算量が加速度的に増...
9 search resultsShowing 1~9 results
Qiita is a knowledge sharing service for engineers.