こんにちは!株式会社ナイトレイの開発部のアレックスです!
この記事で、OpenAIの「GPT-4.1」という最新のAIモデルにぴったりな使い方や工夫をご紹介します!前に書いた記事「LLMプロンプトエンジニアリングの普遍的テクニック」では、いろんなAIで使えるプロンプトテクニックを紹介しました。良ければその記事もご覧ください。
GPT-4.1は、2025年5月14日にAPI向けに、5月24日にWeb版のChatGPTでも使えるようになりまして、最大100万トークンまでの長いコンテキストを扱える新しいアーキテクチャで、コーディング、指示の理解、長文処理の性能が従来モデルよりも大きく向上しています。
さらに、小型モデルの「GPT-4.1 mini」や「GPT-4.1 nano」も登場しており、それぞれコストと速度の面で優れたバランスを持っています。
この記事では、OpenAIが公式に公開した「Introducing GPT-4.1 in the API」および「GPT-4.1 Prompting Guide」の2つのガイドをベースに、そこに含まれるベンチマーク結果・開発者の活用事例・実践的なプロンプト手法などをふまえて、開発現場での工夫や効果的な使い方をご紹介していきます。
GPT-4.1ってどんなモデル?
GPT-4.1は、以前のGPT-4やGPT-4oと比べて次のような違いがあります:
- **Long context!**最大で100万トークン(=Reactのコードベース8個分相当)を扱える
- 形式に沿った指示の解釈や否定命令(例:「○○しないで」)がより正確にできる
- コーディング性能が上がった(SWE-bench Verifiedで54.6%)
つまり、明確で構造的な指示を与えることで、GPT-4.1はより正確かつ意図通りに動いてくれます。
1. エージェント風のプロンプト設計
GPT-4.1は、ステップごとに思考し、道具を使いながら作業を完了するようなプロンプト設計に向いています。
特に次の3つを明確に伝えると効果的です:
- 途中で止まらずに最後までやりきること(Persistence)
- 必要ならちゃんとツールを使うこと(Tool-Calling)
- やる前に計画を立てて、終わったら振り返ること(Planning)
2. ツールの使い方をはっきり伝える
GPT-4.1では、ツールの呼び出しにおいて、明確な構文・命名・入力構造が重要です。
- ツール名は
fetch_user_info
のように動作+対象の形式 - 説明は短く簡潔に
- パラメータ名は
user_id
,email
のように意味がわかるようにする
こうすることでツール呼び出しエラーが減り、意図通りの動作が期待できます。
3. 考えさせるプロンプトを使う(Chain-of-Thought)
GPT-4.1は、一足飛びの答えよりも段階的思考の促し(CoT)によって正確性が向上します。
この方法は、特に難易度の高い質問や複数条件が絡む命令に効果的です。
CoTについては「LLMプロンプトエンジニアリングの普遍的テクニック」でより詳しく説明しています!
4. 長い文章をうまく扱うための工夫
GPT-4.1は、最大で100万トークンの入力を処理できます。これは、従来のGPT-4o(128,000トークン)よりも約8倍です。
ただし、すべてを均等に読めるわけではありません。重要なのは:
- 命令はコンテキストの前方に置くのが効果的(注意の集中が前に寄る傾向がある)
- Markdown構造やXMLなどで情報を区切ることで重要な情報が際立つ
- 似たような文が並ぶと誤認識するリスクがあるため、冗長さを避ける
5. はっきりしたルールを伝える
GPT-4.1は、「何をしてほしくないか」や「どの順番で対応すべきか」といった詳細な指示を従来以上に正確に守れるようになりました。
# インストラクション
- ユーザーの話には、要点をまとめて返事をする
- 返事の前に、いつも挨拶を入れる
- 外の情報は使わず、ツールで調べる
こういったMeta Prompting(手順を先に示す形式)は、複雑なシナリオにも有効です。
まとめ:GPT-4.1から学んだこと
GPT-4.1の登場で、より実践的・構造的なAI活用が可能になりました。
- 曖昧な指示ではなく、構造的で明確なプロンプトが求められる
- CoTによる段階的思考の誘導が精度向上に寄与
- 100万トークンという長文コンテキストへの対応により、法務・コードリーディング・大規模ドキュメント処理に強い
- エージェント的思考(ツール使用・マルチステップ・フィードバック)は、アプリ開発にも応用可能
おまけ:GPT-4.1 miniとGPT-4.1 nanoについて
GPT-4.1には、小型モデルである「mini」と「nano」もあります。
-
GPT-4.1 mini:
- Chatgptのウェブ版では4o-miniの代わりになりました。
- GPT-4oよりも速く、コストも約83%安いのに、同じかそれ以上の頭の良さを持っています。
- コーディングや指示の理解にも強く、処理速度が早いので、リアルタイムのアプリや会話系のシステムにも向いています。
-
GPT-4.1 nano:
- 一番軽くて一番速いモデルです。
- コストも非常に安く、分類や自動補完のようなシンプルで大量の処理が必要な場面で活躍します。
- こちらも100万トークンの長い文脈に対応しています。
それぞれのモデルは、使う目的やコスト・スピードのバランスによって選ぶと良いです。
質問や感想があれば、ぜひコメントしてください!