はじめに
新卒エンジニア採用の現場で、最近こんな会話をすることが増えました。
- 「GitHubのプロフィールも面接の受け答えも完璧。でも入社後、コードレビューで首を傾げる場面が想像以上に多い」
- 「逆に面接が苦手で落としそうだった子が、配属後にめちゃくちゃ伸びている」
ChatGPT / Copilot / Cursor が当たり前の道具になってから、この「履歴書・面接スコアと現場パフォーマンスのズレ」がさらに大きくなった気がしませんか?
本記事は、新卒エンジニア採用に関わる人事・採用担当・現場エンジニアリーダーに向けて、「AI時代の新卒採用は、何をどう評価すれば本当にハズレないのか」を、ワークサンプルテスト(実務試験)という観点から書きます。後半では、その具体例として弊社が運営している N限(Ngen)インターン(実務試験を90分・¥3,300で受けてもらえる仕組み)を紹介します。
1. 履歴書と面接で見抜けていたもの、見抜けなくなったもの
新卒採用が長らく依存してきた評価ルートは、ほぼこの3つです。
- 履歴書(学歴・経歴・自己PR)
- オンラインコーディングテスト(アルゴリズム系)
- 面接(技術面接+人物面接)
それぞれが何を測っていたのか、エンジニア視点で整理するとこうなります。
| ステップ | これまで測れていたもの | AI時代に揺らいだ部分 |
|---|---|---|
| 履歴書・GitHub | 過去の蓄積・成果物 | 「本人の実力か、AIに書かせた成果物か」が区別できない |
| コーディングテスト | アルゴリズム力・基本構文力 | LeetCode系問題はAIで満点が出る。差がつかない |
| 技術面接 | コミュニケーション・思考プロセス | 想定問答の暗記で底上げが効きすぎる |
特にオンラインコーディングテストは、ここ1〜2年で「足切り」としての精度が劇的に落ちました。Copilot / Cursor に慣れた学生は、何の問題もなくスコアを取ってきます。それ自体は良いことなのですが、スコアを高く取れる学生の母集団が広くなりすぎて、識別力が下がっているのが現場の体感ではないでしょうか。
つまり、AI時代の新卒採用において、履歴書と面接の間に「もう一段だけ実務に近い評価」を挟まないと、本当に欲しい学生を見落とすリスクが高くなっている、というのが本記事の問題提起です。
2. 本当に評価したいのは「コードを書けるか」ではない
新卒エンジニアに対して、本当に評価すべきポイントは何でしょうか。
現場のテックリードや EM 陣に話を聞いて、ほぼ例外なく挙がるのは次の3つです。
- 曖昧な要件を、設計判断にまで落とせる解像度(仕様書がなくても作れる)
- トレードオフを言語化できる(「なぜA案ではなくB案なのか」を1分で説明できる)
- プロダクトの「思想」に判断を寄せられる(パーパスやユーザー価値に紐づいた選択ができる)
これらは、いずれもAIで代替されない領域です。逆に言えば、これらこそAI時代に差がつく評価軸です。
ところが、これらは履歴書からも面接からも見えにくい。理由は単純で、
- 履歴書: 完成形しか書いていない。プロセスが消えている
- 面接: 想定問答が用意できる。本人の素の判断は見えにくい
ここに、面接の前に「90分の実務試験」を一本挟むという設計が効いてきます。
3. ワークサンプルテストという選択肢
「採用時に、実務に近い課題を時間制限つきで解いてもらう」という手法(ワークサンプルテスト/work sample test)は、海外では既に新卒採用の標準ルートになっています。Forage、Parker Dewey、Vervoe、Riipen などのプラットフォームを通じて、Goldman Sachs / BCG / JPMorgan などが新卒採用のスクリーニング段階で活用しています。
これをエンジニア採用文脈に翻訳すると、たとえばこういう設計になります。実際に弊社があるバーティカルSaaS企業向けに用意している、エンジニアインターン向け実務試験のサンプル構成です(クライアント名・業界を特定する固有表現は伏せています)。
【90分・実務試験の例:在庫流通プラットフォーム設計】
背景:
企業間で余剰在庫・端材を流通させる新機能を構想中
(プロダクトには「循環性の最大化」という強い思想がある)
配布データ:
企業5社の在庫インベントリCSV
- 表記揺れ(同一品目を複数の呼称で記録)
- 単位の不統一(kg / ton / t / L / ㎥)
- 品質グレード表記の粒度バラバラ
- 業界固有の法規制タグが混在
成果物(3点):
1. データモデル設計(ER図 + 代表1テーブルのカラム定義)
2. API設計(コア1エンドポイント + JSON例 + 法規制チェックのタイミング)
3. 実装スケッチ(擬似コード 10〜15行)+ 技術選定理由2点 +
「この設計がプロダクト思想(循環性の最大化)の実装になっている理由」
評価軸(4軸 × 20点 = 80点満点):
- データモデリング力
- API・システム設計力
- 実装適性(エンジニア思考)
- パーパス適性(プロダクト思想を判断に反映できるか)
ポイントは、「コードを完璧に書け」ではなく、「曖昧な仕様の中で、何をどう判断したかが残る課題」を出すことです。SQL実行環境もコード実行環境も不要。手書きER図と擬似コードで十分です。
90分で見たいのは「完成度」ではなく思考の解像度だからです。
そして、この設計には副次的な効果があります。評価軸の中に「パーパス適性」が入っているので、技術力は同じくらいでも自社のプロダクト思想にフィットする学生が浮き上がる、という構造になります。これは面接だけでは見えにくい部分です。
4. 「面接1時間」と「実務90分」、何が変わるか
採用担当の視点で、面接と実務試験を比較するとこうなります。
| 評価方法 | 1名あたりコスト | 評価できるもの | AI耐性 |
|---|---|---|---|
| 履歴書スクリーニング | ほぼ0円 | 過去の経歴のみ | 低(AI整形可能) |
| 技術面接1時間 | 面接官1〜2名 × 1時間 | コミュニケーション・基礎知識 | 中(想定問答が組める) |
| 実務90分(ワークサンプル) | 1名あたり ¥3,300 程度〜 | 仕様→設計→実装の判断プロセス | 高(リアルタイム制限で素の判断が出る) |
ここで重要なのは、**「面接の置き換え」ではなく「面接の前に挟む」**という発想です。
具体的には:
- 履歴書通過 → 90分の実務試験(オンラインで受験) → スコア上位の学生だけを面接に呼ぶ
- 結果: 面接1時間 × 50人 → 面接1時間 × 10人 + 実務90分 × 50人
人事の体感としては、「面接にどんな学生を呼ぶか」の判断材料が、面接前に1枚増える、という感じです。しかもその1枚は「本人が90分で出してきた成果物 + 4軸スコア」なので、面接で何を深掘りすべきかも明確になります。
「うちのコードレビュー文化に合うかどうか」「うちのプロダクトの判断軸に同調できるかどうか」を、面接で初めて探るのではなく、面接前にレポートで見えている状態を作る。これが、AI時代の新卒採用に効く一番大きなアップデートだと思っています。
5. N限インターン:実務90分を ¥3,300 で受けてもらえる仕組み
ここまでの話を、企業側がそのまま使える形で実装したのが、私たちが運営している N限(Ngen)インターン です。
| 項目 | 内容 |
|---|---|
| 何をするか | 学生がオンラインで実務試験を受験(90分・成果物3点・思考プロセスも記述) |
| 企業に届くもの | 4軸 × 20点 = 80点満点のスコアレポート(等級 S/A/B/C/D で可視化) |
| 1名あたりコスト | ¥3,300(学生報酬 ¥3,000 + プラットフォーム手数料 ¥300) |
| 対象学生 | 早稲田・京大などの難関大生中心 |
| 実務試験のジャンル | エンジニアリング(バーティカルSaaSのデータ基盤設計など)/データエンジニアリング/SNSマーケティング戦略立案/広告クリエイティブ改善/コンテンツ企画・ライティング/リサーチ・競合分析/X バズ企画/TikTok 企画 など |
なぜ ¥3,300 で実現できるかというと、実務試験の中身そのものを弊社で用意しており、評価ルーブリックも標準化されているからです。企業側が用意するのは「どのジャンルの試験を出すか」を選ぶことだけです。
エンジニア採用なら、先ほど例示した「データモデル設計 + API設計 + 実装スケッチ」のようなセットを、自社プロダクトの題材に差し替えて出すこともできます。
端的に言うと、
面接の1時間が、レポート1枚に変わります。
これがいちばん分かりやすい変化です。
6. 導入で気をつけたいこと
最後に、ワークサンプルテストを新卒採用に組み込むときの注意点を3つだけ。
1. 「完成度」ではなく「思考プロセス」を点数化するルーブリックにする
完成度や見た目を点数化すると、結局AIで埋められて識別力が下がります。「なぜその設計にしたか」「どのトレードオフを切ったか」のように、本人の判断が残るポイントに配点する設計にしてください。
2. 時間制限を効かせる(90分前後が現実的)
長すぎると本人以外の手が入る余地が増えます。逆に短すぎると思考が浅くなる。実務試験は90分前後が、現場の試行錯誤の感覚では最もバランスが良いゾーンです。
3. 学生側へのフィードバックを必ず返す
一方的なスクリーニングは応募体験を悪化させます。実務試験は「学生が学べる場」にもなるので、ここをセットで設計すると、結果として採用ブランドの強化にもなります。
おわりに
「AIで誰でも書ける時代」だからこそ、書いたコードそのものではなく、どう判断したかを見る評価が効きます。
履歴書と面接の間に「実務90分」を1本挟むだけで、新卒エンジニア採用の解像度は思っているより上がります。AI耐性のあるスクリーニング層を、いま採用設計に組み込んでおくと、来年の母集団選別が一段楽になるはずです。
「自社のエンジニア採用で、どんな90分の実務試験を出せばいいか」を一緒に設計したい方は、お気軽にお問い合わせください。職種・プロダクトに合わせた既存テンプレートをすぐにご紹介できます。
- サービス概要(企業の方向け): https://ngen-intern.jp/company
- 使い方ガイド: https://ngen-intern.jp/company/guide
- お問い合わせ: https://ngen-intern.jp/contact
この記事の前提
- 弊社(CEOパートナー株式会社)は新卒向けワークサンプルテスト型インターン「N限インターン」を運営しています
- 本記事は採用担当者・エンジニアリングマネージャー向けに、AI時代の新卒採用の論点を整理したものです
- ご質問・ご相談は記事末尾のリンクからどうぞ