https://www.alphaxiv.org/overview/2604.12374 を読んだメモです。
書誌情報
研究機関:NVIDIA
- Nemotron 3 SuperはNVFP4での低精度学習をしている
- Mamba2, LatentMoE, Attentionのハイブリッドアーキテクチャである
- LatentMoEは、MoEの前に潜在空間に射影することで計算量を落とす
- マルチトークン予測(MTP)は投機的デコーディングをネイティブでサポートする
Go to list of users who liked
Share on X(Twitter)
Share on Facebook
https://www.alphaxiv.org/overview/2604.12374 を読んだメモです。
研究機関:NVIDIA
Register as a new user and use Qiita more conveniently
Go to list of users who liked