deepseek

75posts
25followers

Login and follow tags to see the latest information.

About deepseek

【速報】 中国DeepSeekは、オープンAIモデル「DeepSeek-V3.2」および高性能版「DeepSeek-V3.2-Speciale」を2025年12月1日に公開しました。 これらのモデルは、GPT-5やGemini 3と同等以上のベンチマークスコアを記録しており、Speciale版はGPT-5 Highなどを上回る計算能力の強化が特徴です。 モデルデータはHugging Faceで公開され、API経由でも利用可能であり、計算効率の高さも備えています。


DeepSeek(ディープシーク) は、中国の定量的ヘッジファンド High-Flyer(高飛) の技術チームを母体として設立された AI 研究組織です。効率性とコスト最適化を重視した大規模言語モデル(LLM)の研究・開発を行っており、モデルの重みデータを含む オープンウェイト(オープンソース) 形式で公開している点が特徴です。

数学・プログラミング・論理推論などのタスクで優れた性能を示すモデルが多く、オープンモデルとして国際的に注目を集めています。

主なモデル・技術

  • DeepSeek-V 系列(V3 / V2)
    • MoE(Mixture-of-Experts) を採用したフラッグシップモデル。
    • 高い性能と、従来より低い計算コストの両立を目指した設計。
    • 多くのベンチマークで良好な結果を報告。
  • DeepSeek-R1
    • 「思考過程を内部で展開してから回答する」タイプの推論強化モデル。
    • 数学・パズル・論理問題など、推論負荷の高いタスクに強み。
  • DeepSeek Coder
    • コード生成や補完に特化したモデル。
    • 開発者向けツールやローカル LLM 環境で広く利用されている。
  • Multi-head Latent Attention (MLA)
    • DeepSeek が開発した軽量化アテンション方式。
    • 従来より KV キャッシュのメモリ使用量を削減し、
    • 長文処理や推論速度向上に貢献する技術として採用されている。

リファレンス

関連タグ

User Rankings
Weekly
Monthly
Yearly
Organizations ranking
Monthly
All