LLMを活用して「面談の文字起こし」から職務経歴書を自動生成・構造化するプロンプトエンジニアリング
はじめに
議事録の作成やドキュメントの構造化など、実務におけるLLM(大規模言語モデル)の活用が急速に進んでいます。その中でも、音声認識(Speech-to-Text)ツールで出力された「荒い口語テキスト」を、人間が読める綺麗なビジネス形式に整形・構造化するタスクは、プロンプトの設計次第で精度が大きく変わる難易度の高い領域です。
今回は、エンジニアの面談音声やヒアリングの文字起こしデータ(主語が抜けがちで時系列が前後しやすいテキスト)をインプットとし、LLMを使って過不足なく「職務経歴書(スキルシート)」のフォーマットへと構造化・自動生成するためのプロンプト手法と技術的なアプローチについて解説します。
1. 音声書き起こしテキストが持つ「構造化の課題」
Whisperなどの音声認識ツールで文字起こしした生テキストは、以下のような特徴や課題を持っています。
- 「えっと」「あの」といったフィラー(無駄な言葉)や相槌が多数混入する
- 主語や目的語が省略されやすく、文脈の前後関係を読まなくとも意味が通じない
- 雑談が混ざったり、話の時系列が前後したりする
これらをそのままLLMに投げて「綺麗な経歴書にして」と単純に指示するだけでは、重要な技術スタックや期間が抜け落ちたり、逆にLLMが勝手に存在しない実務経験を捏造する「ハルシネーション(幻覚)」が発生したりします。
この課題を解決するためには、LLMへの指示(プロンプト)において「役割」「処理手順」「制約条件」「出力フォーマット(few-shot)」を厳格に定義する必要があります。
2. 構造化のためのプロンプト設計
以下は、口語体のテキストから「プロジェクト概要」「担当工程」「使用技術」「具体的な実績」を正確に抽出し、適切なビジネス文章へ整形するためのシステムプロンプトの設計例です。
今回はマークダウン形式での出力を指定していますが、Webシステムのバックエンドと連携させてデータベースに保存する場合は、JSON形式での出力(JSON Mode)を指定するアプローチも非常に有効です。
# 役割
あなたは優秀なテクニカルエージェントであり、データ構造化のスペシャリストです。
入力された雑多な面談・ヒアリングの文字起こしテキストを分析し、エンジニアの「職務経歴書」の形式に厳密に構造化してください。
# 処理手順
1. テキスト内から「プロジェクト(案件)の塊」を時系列順に特定する。
2. 各プロジェクトにおける、期間、システム概要、担当工程、使用技術、チーム規模、具体的な実績(定量的な効果・定性的なプロセス)を抽出する。
3. 雑談やフィラーは徹底的に排除し、ビジネス文章(敬体または常体の統一)として整形する。
# 絶対厳守の制約条件
- ハルシネーションの禁止:入力テキストに記載のない技術、言語、フレームワーク、経験年数、実績の数値を勝手に捏造(補完)してはならない。
- 曖昧な表現の具体化:例えば「ジャバ」とあれば「Java」、「AWSのサーバー関連」とあれば「AWS(EC2, RDSなど、文脈から判断できるもの)」のように、IT業界の標準的な表記に変換すること。
- テキスト内に技術スタックの明記がない場合は、そのプロジェクトの「使用技術」の項目は「不明」または「記載なし」とし、推測で埋めないこと。
# 出力フォーマット
以下のマークダウン形式で出力してください。
### [プロジェクト名]
- 期間:
- 担当工程:
- チーム規模:
- 使用技術(言語・環境):
- 業務内容・具体的な立ち回り:
- 成果・実績:
3. 精度を高めるための技術的アプローチ(Few-shotプロンプトの活用)
LLMに対して出力の「クオリティの基準」や「文章のトーン&マナー」を的確に学習させるには、指示の後に「入力例」と「理想的な出力例」を最低1セット提示する「Few-shotプロンプト」を組み込むのが最も効果的です。
Few-shotの具体的な組み込み例
# 入力例
「あ、前の現場ですか?2024年の4月から半年くらい、某ECサイトのバックエンドをやってました。Javaのスプリングブート使ってAPIの実装とかバグ修正がメインですね。毎日朝会があって、エラーログを自ら分析して影響範囲を調査した上で修正を投げてました。レビューで落とされてもチームとすり合わせてすぐ直してましたね」
# 出力例
### 大手ECサイト バックエンド開発および保守
- 期間:2024年4月 〜 2024年10月(6ヶ月)
- 担当工程:詳細設計、コーディング、単体テスト
- 使用技術:Java / Spring Boot
- 業務内容・具体的な立ち回り:
ECサイトにおけるバックエンド領域の開発に従事。主にSpring Bootを用いたAPIの実装および不具合修正(バグフィックス)を担当。日次の朝会にて検知されたエラーに対し、能動的にエラーログを分析して影響範囲を調査・特定。修正ソースコードの提出からコードレビューの対応までを一貫して行い、チームメンバーと密に連携しながら迅速な修正対応を行った。
- 成果・実績:自走力を活かした迅速なデバッグ対応により、チームの開発速度維持に貢献。
単なる事実の羅列(「バグ修正をしました」)で終わらせず、その背後にある「どのような手順で、どう周囲と連携して動いたか」という現場での能動的な立ち回りをLLMに言語化させることで、職務経歴書としての実用性とアピール力が跳ね上がります。
4. さらなる発展:自律型AIエージェントとの連携
2026年現在、こうしたテキスト構造化タスクは単発のプロンプトを投げるだけでなく、Claude Codeなどの自律型AIエージェント、あるいはMCP(Model Context Protocol)を介した外部ツール連携へと進化しています。
例えば、文字起こしされたテキストに不明な点(「○○システムをやった」とあるが具体的な言語やインフラの記載がない等)がある場合、AIエージェント自身が「技術スタックの補完が必要」と自動で判断し、過去の類似案件レジストリを検索して確度の高い候補を採用担当者にサジェストする、といったマルチエージェント設計も実用化され始めています。
おわりに
音声認識とLLMの組み合わせによるドキュメントの構造化は、プロンプトの制約条件をいかに実務レベルの解像度で落とし込めるかが成功の鍵を握っています。
私たちが所属する株式会社フェローシップのDX事業部では、こうした最先端のAI・LLMを活用した業務効率化や、Claude Code等を取り入れたAI駆動開発を現場レベルで実践しています。
大手企業や急成長企業などのエンドクライアント直案件や商流の浅い案件をメインに扱っており、エンジニアが現場で築いた信頼や成果(チーム拡大や増員などのビジネス的貢献)を、ごまかすことなくストレートに評価・還元する仕組みを整えています。
また、現場調整を行う営業担当だけでなく、国家資格キャリアコンサルタントを保有するメンバーが多数在籍する専属のキャリア支援担当がつくWサポート体制を敷いており、面談への丁寧な対策から長期的なキャリア設計まで徹底的に伴走します。
「今の環境での自分の評価、適正なのかな?」
「AI時代を生き抜くために、上流工程やモダンな開発にシフトしたい」
システム開発の知見を強みに変え、次のステップへ挑戦したいエンジニアの方の、情報収集やキャリアの壁打ちだけでも大歓迎です。少しでも興味を持っていただけた方は、ぜひ一度私たちのページを覗いてみてください!