Search result of “user:liushuzhi”

5 search resultsShowing 1~5 results

2025/07/16

カリキュラム学習の成功と失敗: GLM-4.1VとSkywork-R1V3の比較分析 TL;DR GLM-4.1Vは動的サンプリングによるカリキュラム学習で28ベンチマークで一貫した性能向上を達...

Comment0

2025/07/18

TL;DR（要点まとめ） FSDP2はPyTorchの最新ZeRO-3実装で、限られたGPUメモリで大規模モデル学習を可能にする 7Bモデルでも通常110GB+のメモリが必要だが、FSDP2によ...

Comment0

2025/07/14

TL;DR Skywork R1V3はマルチモーダル推論でSOTAを達成したVLM 「クリティカルトークンエントロピー」で本物の推論力を判別コネクターモジュールはRL安定化の鍵カリキュラム学...

Comment0

2025/07/12

はじめに Qwen 2.5 VLはAlibabaが開発した強力なVision-Language Model（VLM）です。画像や動画の理解、物体のローカライズ（Grounding）、ドキュメント...

Comment0

2025/07/10

DataRater 論文用語解説：「Meta-Learning」と「Unrolled Optimization」「どのデータが本当に価値あるのか？」—— その答えをモデル自身に見つけさせる ...

Comment0

5 search resultsShowing 1~5 results

Qiita is a knowledge sharing service for engineers.

Search article