
厚労省の賃金統計PDFを、Claude Opus 4.8で「読める」可視化サイトにした話
つくったもの
🔗 https://salary.soniclab.cc/?lang=ja
厚生労働省「令和7(2025)年 賃金構造基本統計調査」を、性別・年齢・学歴・企業規模・産業・雇用形態・勤続年数・役職・在留資格・都道府県の11の切り口でスクロールテリング形式に可視化したサイトです。日本語/English/中文の3言語に対応しています。
なぜ作ったか
政府統計は質も網羅性も高いのに、配布形式がPDFの表で、「数字は読めるが頭に入らない」状態になりがちです。元になったのはこのPDF(14.pdf)。情報としては完璧ですが、ここから「日本の賃金ってこうなってるのか」という直感を得るのは難しい。
やりたかったこと: 「1枚の統計表を、読める地図へ」。
数字の正確さは保ったまま、スクロールするだけで構造が腹落ちする体験にする。
制作プロセス:Claude Opus 4.8 をどう使ったか
ざっくり言うと、PDFの構造化 → ナラティブ設計 → 実装の各段階で Claude Opus 4.8 を使いました。
- データ抽出:PDFの各表(第2表〜第9表、付表ほか)から数値を読み取り、扱いやすいデータ構造に整理。表ごとに「何が主役の数字か」を言語化させる。
- ナラティブ設計:単に全グラフを並べるのではなく、各セクションに「一番伝わる1文」を持たせる構成にしました。たとえば学歴のセクションなら「大学院卒は高校卒の1.7倍」のように、最初に結論となる数字を立てる。
- 実装:スクロール連動のセクション、グラフ、都道府県のタイルマップ、3言語の文言出し分けまでを生成・調整。
ポイントは、Opus 4.8 が**「数字の正確さ」と「物語としての分かりやすさ」を両立させやすい**ことでした。各セクションのコピー(見出しやリード文)も、データの含意を外さずに書けるので、可視化と文章を行き来する作業が一気通貫でやれます。
工夫したところ
平均の罠を可視化する構成:「平均340,600円」をまず提示し、その後で性別・地域・雇用形態に分解して「平均は誰の実感とも一致しない」を体感させる流れにした。
タイルマップ:都道府県差は正確な地理より「東京が突出/全国平均超えは4都府県だけ」という構造が伝わることを優先し、簡略化したタイルマップにした(この点はサイト内に注記)。
出典の明記:可視化目的の非公式な再構成であることと、厚労省の出典リンクを明示。政府統計を扱うときの最低限のマナーとして。
元データの主要数値(メモ)
平均所定内給与(男女計): 340,600円/月(前年比+3.1%、過去最高)
男性 373,400円/女性 285,900円(男=100で女76.6)
中位数(男女計): 296,600円
調査対象: 常用労働者10人以上の民営事業所 52,242事業所/有効回答率75.4%
まとめ
政府統計PDF × LLM は、「正確だが読みにくい一次情報」を「正確で読みやすい体験」に変える相性のいい組み合わせだと感じました。次は別の統計(家計や物価など)でも同じ手法を試してみたいです。
ソースや手法について質問があればコメントどうぞ。
