0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

今噂のManusってAIについて調べた

Posted at

Manus(マヌス)AIの概要

各モデルのプログラミング能力比較

Manus AIのプログラミング能力について、ChatGPT 4.5、OpenAI o3、Claude 3.7 Sonnetと以下の観点で比較します。

評価基準 Manus AI ChatGPT 4.5 OpenAI o3 Claude 3.7 Sonnet
コード生成の正確性 非常に高い。ManusはGAIAベンチマークでOpenAIの研究モデルを上回る性能を示しており ([中国発の汎用AIエージェントManus(マヌス)とは?概要やユースケースを解説! WEEL](https://weel.co.jp/media/innovator/manus/#:~:text=%E3%81%BE%E3%81%9F%E3%80%81%E3%80%8CManus%E3%80%8D%E3%81%AF%E7%AC%AC%E4%B8%89%E8%80%85%E6%A9%9F%E9%96%A2%E3%81%AB%E3%82%88%E3%82%8B%20GAIA%E3%83%99%E3%83%B3%E3%83%81%E3%83%9E%E3%83%BC%E3%82%AF%EF%BC%88%E6%B1%8E%E7%94%A8AI%E3%82%A2%E3%82%B7%E3%82%B9%E3%82%BF%E3%83%B3%E3%83%88%E3%81%AE%E6%80%A7%E8%83%BD%E8%A9%95%E4%BE%A1%EF%BC%89%E3%81%AB%E3%81%8A%E3%81%84%E3%81%A6%E3%80%81%E5%BE%93%E6%9D%A5%E3%83%A2%E3%83%87%E3%83%AB%E3%82%92%E4%B8%8A%E5%9B%9E%E3%82%8B%E6%9C%80%E9%AB%98%E6%80%A7%E8%83%BD%E3%82%92%E8%A8%98%E9%8C%B2%E3%81%97%E3%81%A6%E3%81%8A%E3%82%8A%E3%80%81OpenAI%E3%81%AE%E3%83%A2%E3%83%87%E3%83%AB%E3%82%82%E5%87%8C%E9%A7%95%E3%81%99%E3%82%8B%E3%82%B9%E3%82%B3%E3%82%A2%E3%82%92%E9%81%94%E6%88%90%20%E3%81%97%E3%81%A6%E3%81%84%E3%81%BE%E3%81%99%E3%80%82))、総合的な問題解決能力が極めて優れます。実行可能コードを直接生成・実行し、エラー修正まで自動で行うため、コードの正答率・正確性は高く保たれます (深まるAI競争時代に登場した中国発の新星・Manis AI――自動化エージェントが切り開く未来とは|D × MirAI)。 高い。GPT-4.5は知識量と推論能力が従来モデルより向上しており、プログラミング課題でも優れた性能を示します (OpenAI推出GPT-4.5:最强知识型模型,“AI味”、幻觉大幅减少_腾讯新闻)。ただし一部の専門ベンチマークでは、特化モデル(例:o3)に及ばないケースも報告されています (OpenAI推出GPT-4.5:最强知识型模型,“AI味”、幻觉大幅减少_腾讯新闻)。 非常に高い。OpenAIのo3-mini-highモデルはLiveBenchコードベンチマークで平均スコア82.74を記録し、他のモデルを大きく上回るトップクラスの成績でした (OpenAI Just Released o3-mini: Best coding model right now (better than DeepSeek R1))。コード生成では現時点で最も優秀なモデルの一つとされています (OpenAI Just Released o3-mini: Best coding model right now (better than DeepSeek R1))。
アルゴリズムの最適化能力 高い。与えられた目標に対しタスクを自律的に細分化し (深まるAI競争時代に登場した中国発の新星・Manis AI――自動化エージェントが切り開く未来とは|D × MirAI)、必要な情報収集・分析・実行を効率良く行えるため、問題に適したアルゴリズムを構築できます。コードの実行結果を踏まえて逐次改善することで、解法の最適化も可能です。 高い。膨大な知識により古典的手法から最新アルゴリズムまで熟知しており、効率的な実装や高度なデータ構造の提案もできます。もっとも、明示的な指示が無い場合は必ずしも最善とは限らず、標準的な実装に留まることもあります。 中~高。高度な論理推論にチューニングされており (OpenAI Just Released o3-mini: Best coding model right now (better than DeepSeek R1))、与えられた課題に対するアルゴリズムを考案する能力はあります。ただモデル規模が限定的なぶん、非常に高度・抽象的な最適化問題ではGPT-4.5やClaudeほど柔軟でない場合もあります。 高い。Claude 3.7は**複雑な問題をステップ分解する推論(チェイン・オブ・ソート)**に長け (Claude 3.7 Sonnet: Anthropic’s most intelligent model now available on Amazon Bedrock)、競技プログラミングのような難問でも拡張思考モードで深く分析し最適解に近づけます (Claude 3.7 Sonnet: Anthropic’s most intelligent model now available on Amazon Bedrock)。高度なアルゴリズム設計や最適化にも強みを発揮します。
デバッグ支援 非常に高い。エラー検出と自動修正機能を備え、ライブラリのバージョン違いやコンパイルエラーが起きてもManusが自律的に修正を試みます (深まるAI競争時代に登場した中国発の新星・Manis AI――自動化エージェントが切り開く未来とは|D × MirAI)。コードを実行し結果を検証しながら問題箇所を直してゆくため、人手を介さず高度なデバッグが可能です。 高い。ChatGPTは対話形式でコードの不具合を分析し、修正案を提示できます。GPT-4.5では検索やファイル/画像アップロード、コード編集キャンバス等の機能が追加され (OpenAI推出GPT-4.5:最强知识型模型,“AI味”、幻觉大幅减少_腾讯新闻)、ユーザーがコードを実行・テストしながらバグを特定する作業を強力に支援します。 中程度。コード出力時に簡単な説明やテストケース提案はできますが、対話的にエラーを自動修正する高度な機能は備えていません。他モデルのように内部でコードを実行して検証することができないため、最終的なデバッグ検証はユーザーに委ねられます。 非常に高い。Claude 3.7にはコード理解・修正に特化した**「Claude Code」**エージェントが用意されており、コードベースを読み込んで不具合の原因を指摘し修正することが可能です (Claude 3.7 Sonnet vs. Grok 3 vs. o3-mini-high - Composio)。Git連携によりプロジェクト履歴を参照しつつ問題を解決できるなど、大規模開発向けの高度なデバッグ支援機能を備えています (Claude 3.7 Sonnet vs. Grok 3 vs. o3-mini-high - Composio)。
対応言語の多様性 高い。Manusはクラウド上のLinux環境を直接操作し、PythonやNode.jsなど複数の言語でコードを自動生成・実行できます (深まるAI競争時代に登場した中国発の新星・Manis AI――自動化エージェントが切り開く未来とは|D × MirAI)。タスク内容に応じて適切なプログラミング言語やソフトウェアを選択し、一連の作業を完結できます。 非常に高い。GPT-4.5は膨大なコードデータで訓練されており、Python、JavaScript、C/C++、JavaからSQL、HTML/CSSまで主要なあらゆる言語で回答可能です。言語間の変換や複数言語が混在するシナリオにも対応でき、幅広い技術スタックをカバーします。 高い。o3モデルも幅広い言語のコードを扱えますが、特にPythonでの最適化に強みを発揮しています(実際の作例もゲーム開発などPython中心) (OpenAI Just Released o3-mini: Best coding model right now (better than DeepSeek R1))。一般的な言語には対応する一方、ニッチな言語やフレームワークの知識量は超大規模モデルに劣る可能性があります。 非常に高い。Claude 3.7は多様な言語のコードコーパスで訓練されており、Python、JavaScript、Java、C++など主要言語すべてに精通しています。最大128Kトークンという長大なコンテキストを活かし、大規模なコードベースや複数言語プロジェクトでも一貫して処理できる柔軟性があります。

各モデルの長所・短所

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?