いまだに日本の首相、イランの最高指導者が誰か正確に答えられないClaudeやChatGPTの現実（2026年5月現在）

Last updated at 2026-04-28Posted at 2026-04-28

最新情報、資料理解、業務処理、深い思考、横断整理、創造・クリエイティブ、人生相談、画像生成、長文生成、プログラミング、パワポ作成、資料要約、検閲の少なさ、その他有益点で主要生成AIサービスを比較してみた。
生成AIサービスは次の通り：
ChatGPT
Perplexity
Gemini
Claude
Grok
Copilot

Copilotに比較表を作成させたが概ね正しい気がする。

本家のChatGPTの自動実行やClaudeのHaiku4.5では時事問題を正確に回答できない。単純なやりとりでも情報が間違っていることが多いため、こちらから資料を読ませたものや一般情報がなくても生成できる指示でないと厳しい結果になる。

高市政権、石破政権より前の岸田政権と答えるわけで「モデルは最新」だとしても時事は相当前の情報で、自動でネットの検索にいかない場合は誤った出力、資料が作成されてしまう。単純な問いに対する一種のハルシネーション（嘘）が今すぐに実演できる良い例だ。現在の実行モデルのGPT 5.2〜5.4のナレッジカットオフが2025年8月らしいがこれを信用もできないことがはっきりわかる。

単一の生成AIサービスで全てを賄うことは現時点ではまだ難しい様子。
Claudeが優れていると巷では言われているが、Claudeはこちらから与えたものに対することには一定程度優れていても、社会科学的な事実や一般論、精神的な側面を回答させようとすると困難が伴うことも多い。本家のチャットWindowでHaiku,Sonnet,Opusと違いがあるにせよプラットフォームの特性としての傾向はそんな感じ。プログラミングがChatGPTの方が良いとされる根拠を聞いたらデバッグと試行錯誤のテンポ、書けるコードの幅、コード生成よりClaudeはコード理解、VS Code連携など実行環境やIDE連携のエコシステムなど多面的にはChatGPTの方がまだ強いのではないかとの判断でなるほどと。

「無料」で主要な生成AIサービスを使い倒す場合、単純な事実検索はPerplexityが強いと思う。人情が入った小説作成はGrokが強い。画像生成はGemini。コード理解はClaude。コード生成は指示さえ適切にすれば正直たくさんありそう。業務的な理解や提案はCopilot。用途では本家がいいとは限らない。

単一のサービスで全てができる時代はまだ当面先のようだ。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up