@Seine_A_Shintani(新谷 正嶺)in松尾研AIコミュニティ2025-09-15Humanity’s Last Exam(HLE)とは何か――TruthOwlは DNA +16.9%改善、総合得点も +1.6% 改善(平均は -1.9%)松尾研LLM開発コンペ2025の学びと、医療教育への活かし方
@Seine_A_Shintani(新谷 正嶺)in松尾研AIコミュニティ2025-09-19東大松尾研 LLM開発プロジェクト2025 SFT(QLoRA 4bit / 2エポック)だけで DNA を +16.9% 伸ばせたわけ― DeepSeek‑R1‑Distill‑Qwen‑32B を使った最小限の改修と、その効果のメカニズム