LoginSignup
5
4

More than 1 year has passed since last update.

FLAN-T5-XXL を 3090 で動かす

Posted at

モデルサイズは fp16 で 45 GB くらいです.

8bit にして 3090 24 GB に収まります!

(8bit はバグがありましたが最新 transformers で修正されました https://github.com/huggingface/transformers/issues/20287)

日本語

一応 FLAN-T5 は日本語も学習しているようですが, そのままでは日本語は化けてしまいます.
Tokenizer あたり調整してあげないといけないっぽそうです(面倒だネ...)

5
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
4