OpenAI「GPT-OSS 120B」徹底解説 🚀
2025年、OpenAI は大規模言語モデル GPT-OSS 120B を Hugging Face 上で公開しました。
https://huggingface.co/openai/gpt-oss-120b
これは 1200億パラメータを持つ巨大モデルで、商用利用も可能な Apache 2.0 ライセンスです。
この記事では、公開されたファイル構成や .safetensors ファイルの仕組み、
そして「学習済みモデルの重み」がどのように保存されているのかを詳しく解説します。
🧩 公開されたファイルの構成
openai/gpt-oss-120b のリポジトリには、大きく分けて 3種類のファイルが含まれています。
1. モデル本体(学習済み重み)
GPT-OSS 120B の 中核となるデータです。
AIが学習した知識や推論能力は、この「重みファイル」にすべて詰まっています。
-
model-00000-of-00014.safetensors~model-00014-of-00014.safetensors -
original/配下の.safetensors -
metal/model.bin(Apple Silicon / Metal 用)
💡 .safetensors とは?
- 学習済みモデルの重み(パラメータ)を保存するファイル形式。
- GPT-OSS 120B のような巨大モデルでは、1つのファイルではサイズが大きすぎるため、複数に分割されています(14ファイル)。
- PyTorch・Transformers などのフレームワークで直接読み込める形式。
-
.binよりも 安全で 読み込みが高速な点が特徴。
2. 学習済みモデルの「重み」とは?
AIモデルはニューラルネットワークで構成されており、**パラメータ(重み)**と呼ばれる数値の集まりを持っています。
- GPT-OSS 120B は 約1200億個の重み(パラメータ)を持つ
- 各重みは 32bit(または16bit)浮動小数点として保存される
-
.safetensorsファイルには、これらのパラメータが 行列やテンソル形式でまとめて格納されている
例えば、モデルの内部は次のようになっています:
[ Embedding Layer ] → [ Transformer Block 1 ] → [ Transformer Block 2 ] → … → [ Output Layer ]
↓ ↓ ↓
重み(行列W1) 重み(行列W2) 重み(行列W3)
3. モデル設定ファイル
モデルを正しく読み込むための設定情報です。
-
config.json
→ モデル構造(層数、隠れ次元、MoE設定、最大トークン長など) -
generation_config.json
→ 文章生成時の初期設定 -
tokenizer.json / tokenizer_config.json / special_tokens_map.json
→ トークナイザ関連(テキストをトークンに変換するための辞書やルール) -
model.safetensors.index.json
→ 分割された重みファイルを正しい順番で読み込むためのインデックス
4. サポートファイル
モデルを使いやすくするための補助ファイルです。
-
README.md
→ モデル概要や利用方法 -
chat_template.jinja
→ Harmony形式のチャットテンプレート -
LICENSE
→ Apache 2.0 ライセンス -
USAGE_POLICY
→ 利用ポリシー
⚖️ 制限とバランス
-
完全なオープンソースではない
- モデルの重みや設定は公開
- ただし 学習データや訓練コードは非公開
-
商用利用OK(Apache 2.0)
ただし、法令遵守や倫理的配慮は必要。
📝 まとめ
| 公開範囲 | 内容 | 用途 |
|---|---|---|
| ✅ モデル重み |
.safetensors, model.bin
|
GPT-OSS 120Bを動かす |
| ✅ 設定ファイル |
config.json など |
モデルを正しく読み込む |
| ✅ トークナイザ |
tokenizer.json 等 |
テキストをトークン変換 |
| ✅ 推論テンプレート | chat_template.jinja |
チャット形式で推論 |
| ✅ ライセンス・ドキュメント | README / LICENSE / USAGE_POLICY | 利用ガイドライン |
| ❌ 学習データ | 公開されていない | セキュリティ・競争力のため非公開 |
| ❌ 訓練コード | 公開されていない | 同上 |
GPT-OSS 120B は、学習済みモデルの重みをOSSとして公開した点で非常に意義があります。
これにより、クラウドに依存せず、ローカル環境での実行やカスタマイズがしやすくなり、AI開発の幅が大きく広がります。