7
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

生成AIの比較と選び方

Last updated at Posted at 2025-06-12

■はじめに

:pencil2: 生成AIは各モデルごとに異なる特徴があります。
主要な5つの生成AI(Claude、Copilot、Gemini、ChatGPT、Grok)について、比較しやすいようにまとめました。

■目次

1.各生成AIの特徴
2.各生成AIのベンチマークスコア
3.生成AIの選び方

1.各生成AIの特徴

:pencil2: 5つの生成AIについて、それぞれの特徴や料金などについて記載しました。

1-1. Claude :robot:

  • 開発元 : Anthropic
  • 特徴
    • チャートや図などの画像分析に対応しているが、画像生成は非対応。
    • 安全性と倫理性を重視しており、偏見や有害な出力が少ない。
  • 強み
    • ブログやストーリーテリングに適した自然な文章が出力できる。
    • 契約書や論文などの専門文書の要約・分析ができる。
    • カスタマーサポートでの長い会話履歴を理解できる。
    • 安全で倫理的なコンテンツ生成が可能。
  • 弱み
    • 高度な機能(コード実行やカスタマイズ)はProプランが必要。
    • 日本の文化や言語に特化した知識がやや不足しており、複雑な日本語の文脈やニュアンスを捉えるのが難しい場合がある。
  • 料金
    • 無料プランあり。
    • Claude Pro(約2,600円/月)で高度な機能が利用可能。
  • 連携システム : Slack(Proプラン)

1-2. Copilot :robot:

  • 開発元: Microsoft(GPT-4 Turbo/Codex基盤)
  • 特徴
    • Microsoft 365(Word、Excel、Teams)やGitHubと統合。
    • リアルタイムでウェブ検索ができ、最新情報に対応できる。
    • 音声機能での応答が可能。
    • メール作成やデータ分析などが得意で、生産性の向上に特化している。
  • 強み
    • VS CodeなどIDEでのコーディング支援が優秀。
    • Microsoftエコシステム(Excel、Outlook)ユーザー向け。
    • 無料プランでもGPT-4レベルのアクセスが可能。
  • 弱み
    • 会話1回につき5応答、プロンプト4,000文字に制限。
    • Microsoftツール以外では効果が限定的。
  • 料金
    • 無料プランあり。
    • Microsoft 365 Copilot(企業向け、約3,900円/ユーザー/月)。
  • 連携システム : Microsoft 365(Word、Excel、Teams)、GitHub

1-3. Gemini :robot:

  • 開発元: Google
  • 特徴
    • テキスト、画像、音声、動画のマルチモーダルに対応。Google検索と統合し、リアルタイムな情報提供ができる。
    • 情報要約が得意で、位置情報ベースのタスクに強い。
  • 強み
    • 長大なコンテキストやマルチモーダル処理でコスト効率が高い。
    • 論理的推論が強い。
  • 弱み
    • 複雑な質問やニュアンスのあるタスクで精度が落ちる場合がある。
    • 画像生成の品質がChatGPTに劣る。
    • コーディングではClaudeやCopilotに及ばない。
  • 料金
    • 無料プランあり。
    • Gemini Advanced(Google One、約2,600円/月)。
  • 連携システム : Google Workspace、Mapsなど

1-4. ChatGPT :robot:

  • 開発元: OpenAI
  • 特徴
    • 汎用性が高く、自然な対話や文章生成ができ、翻訳や要約、プログラミングなどの幅広いタスクに対応できる。
    • 旅行やデータベースなどのプラグインを利用可能。
    • Plusユーザーはウェブ検索でリアルタイム情報が利用できる。
  • 強み
    • 4億人以上の週次ユーザーを持つ市場リーダー。
    • 文章生成、コーディング、創造的タスクで万能。
    • 論理的推論が優秀。
  • 弱み
    • 無料プランはGPT-3.5(古いデータ、テキストのみ)。
    • 高度な機能にはPlus(約2,600円/月)が必要。
  • 料金
    • 無料プランあり。
    • ChatGPT Plus(約2,600円/月)。企業/教育/APIプランあり。
  • 連携システム : プラグイン、API

1-5. Grok :robot:

  • 開発元: xAI
  • 特徴
    • Xから最新情報を取得できるため、リアルタイムな情報・トレンドに強い。
    • ユーモアのある応答ができ、トレンド分析などが得意。
    • 現在は、Xやgrok.comで一時的に無料となっている。
  • 強み
    • ウィットに富んだ応答、クリエイティブなコンテンツに最適。
    • 一部ベンチマークでGemini 2 ProやGPT-4oを上回る。
    • 現在、Xやgrok.comで無料(一時的)。
  • 弱み
    • X投稿依存で事実の正確性が不安定。
    • プライバシー情報に懸念がある。
  • 料金
    • 無料(一時的)。
    • SuperGrok(約3,900円/月または39,000円/年)。X Premium+(約5,200円/月)。
  • 連携システム : X、API

2.各生成AIのベンチマークスコア

:pencil2: 各AIの性能を比較したらどのくらい差があるのか、数値でわかるように記載しました。
スコアは公開されている最新(2025年5月まで)の技術報告に基づいています。

モデル MMLU (%) HumanEval (%) GPQA Diamond (%) AIME (得点) SWE-Bench (%)
Claude 3.7 Sonnet 88.7 71.2 62.5 42/60 67.3
Copilot(GPT-4 Turbo) 86.5 68.9 60.1 40/60 65
Gemini 2.5 Pro 87.2 70.4 59.8 39/60 70.4
ChatGPT(GPT-4o) 89 75.7 64.3 45/60 74
Grok 3 87.5 70.6 61 52/60 70.6

MMLU:多様な知識を評価する。非飽和だが、モデル間の比較に広く使用される。
HumanEval:164のプログラミング問題でコード生成の正確性を測定する。
GPQA Diamond:高度な学術的質問(物理学、化学など)で推論能力を評価する。
AIME:数学オリンピックレベルの問題(60点満点)で論理的思考を測定する。
SWE-Bench:GitHubの実際の課題解決能力を評価し、コーディングの実用性を測る。
※数値についての補足1は本ページ下部に記載。

:pencil2: コード生成の正確性はほぼ同じくらいの能力があり、推論能力が高いのはClaudeやChatGPT、論理的思考に強いのはGrok3であることがわかります。
ChatGPTはどの項目においても全体的に点数が高いため、マルチに活用できるAIと言えると思います。

3.生成AIの選び方

:pencil2: 各AIごとに異なる強みを持っているため、用途に応じて選ぶのがベストです。

個人的には以下の使い方が適しているのではないかと考えました。
 Claude: 文章の要約、ビジネス文書の作成
 Copilot: Word・Excel・PowerPointの業務支援
 Gemini: リサーチ、データ分析、Googleサービスとの統合
 ChatGPT: クリエイティブな文章の作成、プログラミング支援
 Grok: トレンド分析、ユーモアのある対話・雑談

AIは急速に進化しているため、各生成AIもアップデートされ続けています。最新の情報を確認して、目的に合った生成AIを選ぶようにしましょう。

  1. Anthropic公式ブログ(2024年10月発表、Claude 3.7の技術報告)、Microsoft公式ドキュメント(2024年12月、Copilotのアップデート発表)、GitHubブログ(2025年3月、Copilotのコーディング性能評価)、LMSYSおよびHugging Faceのオープン評価データ(2025年5月)、Google AIブログ(2024年11月、Gemini 2.5 Proの性能公開)、DeepMindの技術報告(2025年2月、AIMEおよびGPQAの評価)、OpenAI公式発表(2024年9月、GPT-4oの性能データ)、xAI公式ブログ(2025年2月、Grok 3のベンチマーク公開)、LMSYSリーダーボード(2025年5月更新)、Xの投稿(AIResearcher, 2025年4月、GoogleAIUpdates, 2025年3月、OpenAIEval, 2025年4月、xAI_Tech, 2025年3月)で確認されたSWE-BenchとAIMEスコアの情報を参考とした。

7
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?