DeepSeek を AWS で動かす！（イベント参加レポート）

Posted at 2025-02-20

はじめに

先日、AWS Startupsで開催された以下のイベントに参加しました。

DeepSeek自体は触れたことがあったものの、AWSで動かすというところに惹かれて参加しました。
ハンズオンも体験できましたので、備忘も兼ねて簡単ですが記録しておきます。
（当日はWorkshopsで実施できたので、セルフホストでもお金の心配なく触れました）

LLM、DeepSeekR1について

詳細に説明していただきましたが、私の知識・説明能力では正確に伝えられないので、ベタ書きメモを貼り付けます。

・生成AIのトレンドは事前学習から事後学習のトレンドへ

・Reasoning（論理的推論）
　LLMは知っている知識をしゃべるだけのところからスタート。算数や論理的推論が不得意だった。
　Chain-of-Thought(CoT)：LLMに中間的な推論ステップを生成させて、論理的推論能力を向上させる
　Zero-shot CoT：ステップバイステップで考えようと伝える
　Multi-path CoT with Self-consistency：複数経路の推論を行なってそれらの回答から最終的な結果を導く
　Tree of thought(ToT)：木構造のような思考プロセスで解を探索
　　などの手法で改良を重ねてきた

・DeepSeek-R1-Zero
　事前学習済み　DeepSeek-V3-Baseをベースに強化学習としてGRPOを採用
　Group Relative Policy Optimization：LLMが出してくる回答をまとめて評価する、報酬モデルをルールベースで置き換えて計算効率を高めた
　（強化学習の仕方が上手かった）

・DeepSeek-R1
　強化学習する前に少量のコールドスタートデータ（数千くらい）と複数ステージの学習を行う
　Reasoning重視の強化学習
　600B
　複数のタスクにおいて高度な論理的推論能力を発揮

・DeepSeek-R1-Distill
　R1が大き過ぎるので、蒸留モデルで小型に
　Distill-QwenとDistill-Llamaの２種類

・AWSのAI/ML向けインスタンス
　TrainiumのTrnX、InferentiaのInfX
　NVIDIAのP5eなど

・軽く始めるならサーバレスがオススメ

・セルフホステッドだと外部向け通信を制限できるので、DeepSeekのようなモデルでも外部流出のリスクが排除できる