はじめに
AI開発やLLMの検証では、GPUが必要になる場面が多くあります。
- ファインチューニング
- 推論検証
- データ処理
ただし、GPUサーバーを常時確保するのはコストが高くなりがちです。
そこで選択肢になるのが、従量課金のGPU仮想マシン(GPU VM) です。
本記事では、GPU VMの特徴と使いどころを整理します。
実際に数分でGPU環境を立ち上げ、nvidia-smiで動作確認まで行えるため、
PoC用途として非常に扱いやすいです。
対象読者
- GPUを安く試したいエンジニア
- LLM検証環境を探している方
- PoC用途でクラウドGPUを使いたい方
GPU仮想マシンとは
GPU仮想マシンは、GPUを搭載したクラウド上の仮想サーバーです。
通常のVMと同様に
- CPU
- メモリ
- ストレージ
を持ちながら、GPUを使った計算ができます。
機械学習やLLM処理では、CPUよりもGPUの方が高速に処理できるケースが多くあります。
GPU VMの特徴
FPT AI FACTORYのGPU VMは、従量課金でスポット利用型GPUリソースとして提供されています。
スポット利用とは
- GPUが 空いているときだけ利用可能
- 空きがなければ 起動できない
という仕組みです。
常時利用が保証される環境ではありません。
本番用途ではなく、検証用途を前提に考える必要があります。
メリット
- 必要なときだけGPUを使える
- コストを抑えられる
- すぐに環境を立ち上げられる
想定される利用シーン
GPU VMは、以下のような用途に向いています。
検証・PoC用途
- LLMの動作確認
- ファインチューニングのテスト
- 推論性能の確認
一時的なGPU処理
- データ前処理
- バッチ処理
- 短時間の学習
PoCフェーズでは「常時GPU」よりもスポット利用の方がコスト効率が良いケースがあります。
リザーブドと従量課金GPUの違い
| 種類 | 特徴 | 価格 |
|---|---|---|
| リザーブド | 常に利用可能、本番運用向き | 高 |
| 従量課金(スポット利用) | 空きGPUを利用、検証・実験向き | 低 ※従量課金 |
GPU仮想マシン導入手順
GPU仮想マシンは以下の流れで利用できます。
- FPT AI FACTORYにログイン
- サイドバーの FPT GPUクラウド > GPU仮想マシン を開きます
-
+仮想マシンを作成を押下します
- 一般で以下の項目を設定します
- 仮想マシンにアクセスするで以下の項目を設定します
- 認証で以下を設定します
-
仮想マシンを作成ボタンを押下します
- Windows TerminalでGPU VMへSSH接続します
# user = ubuntuでログインします
ssh -i "C:\Users\ユーザー\.ssh\id_ed25519" ubuntu@VMのPublicIP
# ubuntu userでログイン後にroot権限へ昇格します
sudo -i
# GPUの利用状況やドライバ情報を確認するコマンドを実行する
nvidia-smi
nvidia-smiのコマンドを打つと下図のように、
搭載されているGPUの情報やCUDAのバージョンを確認できます。

GPU VMの課金を止めたい場合は、必ずインスタンスの削除をしてください。
ストレージがNVMEの場合は、インスタンスが停止中も課金されます。
GPUは空きリソースを利用するため、起動できない場合は時間をおいて再試行してください。
セキュリティグループの設定
セキュリティグループ(ファイアウォール)で、どのプロトコル通信を許可するか設定できます。
ここで重要になるのが、SSHポートアタック対策です。
SSHポートアタックの主な手法として、
- ポートスキャン
- ブルートフォース攻撃
などがあります。
これらの攻撃から身を守るためにも、セキュリティグループの設定が重要です。
例えば、ご自身のPCからGPU VMへSSH接続のみご利用の場合、SSH以外のプロトコル通信は不要です。
この場合セキュリティグループの設定で、インバウンド側をSSH接続のみ許可し、ソースにご自身のGlobal IPを設定しておくことで接続対象を絞り込めます。
Global IPは、以下サイトで確認できます。
GPU VMとGPUコンテナの使い分け
FPT AI FACTORYにはGPUコンテナもありますが、用途は異なります。
| サービス | 向いている用途 |
|---|---|
| GPU VM | 自由に環境構築したい場合 |
| GPUコンテナ | 推論APIやIDE(Jupyter Notebook, Code Server)として運用したい場合 |
GPUコンテナで実際にLLMを動かす手順については、以下の記事で紹介しています。
GPU VMは「自由度重視」、GPUコンテナは「運用重視」と考えると分かりやすいです。
まとめ
- GPU VM:自由に環境構築したい場合(検証・開発向き)
- GPUコンテナ:すぐに推論環境を使いたい場合(運用向き)
PoCフェーズでは「まず試すこと」が重要になるため、
従量課金のGPU VMは有効な選択肢の一つになります。
FPT AI FACTORY
- 日本リージョン:https://ai.fptcloud.jp/
- ベトナムリージョン:https://ai.fptcloud.com/
期間限定 無料バウチャー発行中
※新規ユーザー向けに100ドル分のクレジットが提供されています。
詳細は公式ページをご確認ください。




