(1)はじめに
ITストラテジスト試験(午後Ⅱ)は、3つの設問(ア・イ・ウ)に沿って論文形式で回答し、経営課題→企画→対応策の流れを論理的にまとめる力が求められます。
評価ランクはA〜Dの4段階。Aが合格ラインです。
私は今年、この午後Ⅱ論文でA評価=合格しました。
そこでふと思いました。
「合格論文をChatGPT-5に添削させたら、やっぱりA評価になるのか?」
なお、事前に「これは合格論文です」とはChatGPT-5に伝えていません。
あくまで通常の添削依頼として入力しました。
…結果は残念ながら(?)、「B(合格水準まであと一歩)」評価。
この記事では、そのやり取りと分析結果を共有します。
(2)この記事の対象者
- ITストラテジスト試験(午後Ⅱ)を受験予定の方
- 記述式試験対策に生成AIを活用したい方
- ChatGPT-5の実用事例に興味がある方
(3)実験の目的
- 合格論文に対してAIがどのような評価をするかを検証
- 試験準備においてAI添削がどこまで有効かを調査
(4)実験の準備
- 使用モデル:ChatGPT-5(有料プラン)
-
入力データ:
- 採点基準(IPA公式)
- 出題論旨(合格発表近くになると公開されているもの)
- 問題文全文
- 実際の自分の解答(設問ア→設問イ→設問ウ)※IPAへの開示請求で入手(詳細は後日別記事で公開予定)
今回は1設問ごとに送信し、最後に総合評価を求めました。
午後Ⅱ論文のような長文を一度に入力すると、AIが全体を細かく読み込まず、部分的な印象で評価してしまう可能性があります。
そこで、文章のつながりが多少薄れるリスクを承知の上で、設問ア、イ、ウごとに分割して順番に評価してもらう方式を採用しました。
(5)実験の流れ
- 採点基準・出題論旨を送信
- 問題文を送信
- 設問アを送信 → GPTが部分評価
- 設問イを送信 → GPTが部分評価
- 設問ウを送信 → GPTが総合評価&全体講評
実験で使用したプロンプト
実際にChatGPT-5へ送った最初の指示は以下の通りです。
あなたはITストラテジスト試験(午後Ⅱ)の採点官として行動してください。
これから、
1. 採点基準
2. 出題論旨
3. 問題文
4. 私の解答(設問ア・イ・ウ)
を順番に送ります。
各設問を送るごとに、その設問単体での評価コメントをください。
すべての設問を送り終えたら、総合評価と講評をお願いします。
評価はIPAの採点基準(A〜D)に沿って行い、強み・不足点・改善提案を明確にしてください。
(6)GPT-5が出した総合評価
- 想定ランク:B(合格水準にあと一歩)
-
評価コメント(要約):
- 強み:テーマの一貫性、技術の具体性、役割分担や投資額の明示
- 弱み:数値的裏付けが少ない、A社とB社課題の因果関係が弱い、成果の描写不足、誤字あり
「もっと伸ばせる部分」を重視しており、“減点する箇所がない論文=A評価”を基準に見ている印象
(7)考察
なぜ合格論文でもB評価?
- GPT-5は安全圏Aではなく「さらに高得点を狙えるか」を基準に評価している
- 減点の幅が人間の採点官より大きく、人よりも明確な減点法で厳密に評価している印象
- 試験官は要求事項を落とさなければAを付けるという意見もあるが、AIは小さな不足や曖昧表現も容赦なく減点対象にする
- AIは細かい誤字や抽象的な表現にも厳しい
AI添削のメリット
- 試験前のブラッシュアップに有効
- 表現の滑らかさや誤字脱字の指摘が人間より厳格
- 論理構造や不足要素の見える化が可能
AI添削の注意点
- AI評価=試験合否ではない
- 実務感や受験者の経験はAI評価ではやや過小評価される傾向
(8)まとめ
- 結論:合格論文であっても、GPT-5は容赦なく「伸びしろ」を指摘してくる
-
試験活用のポイント:
- 本番前にAIで弱点を洗い出し → 改善案は取捨選択して活用
- 数値や波及効果を意識するとAI評価は上がりやすい
- ※これはAIだけでなく、人間の採点官にも有効
-
今後の応用:
- 過去問答案の自己添削
- グループ学習でAI評価を比較
- 試験以外の業務提案書や企画書の改善にも応用可能
今回の実験で改めてわかったのは、AIは人間の試験官よりも“理想的な論文像”を求めるということ。
だからこそ、「合格するため」だけでなく、その先の上位評価を狙うトレーニングにも最適です。
AIの添削は確かに厳しく、不安になることもありますが、合格論文でもがっつり指摘されるので、多少の減点コメントは気にしなくていいと思います。
安心してフィードバックを受け取り、次のステップに活かしていきましょう。