0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

厚労省の賃金統計PDFを、Claude Opus 4.8で「読める」可視化サイトにした

0
Posted at

image.png
厚労省の賃金統計PDFを、Claude Opus 4.8で「読める」可視化サイトにした話

つくったもの

🔗 https://salary.soniclab.cc/?lang=ja
厚生労働省「令和7(2025)年 賃金構造基本統計調査」を、性別・年齢・学歴・企業規模・産業・雇用形態・勤続年数・役職・在留資格・都道府県の11の切り口でスクロールテリング形式に可視化したサイトです。日本語/English/中文の3言語に対応しています。

なぜ作ったか

政府統計は質も網羅性も高いのに、配布形式がPDFの表で、「数字は読めるが頭に入らない」状態になりがちです。元になったのはこのPDF(14.pdf)。情報としては完璧ですが、ここから「日本の賃金ってこうなってるのか」という直感を得るのは難しい。

やりたかったこと: 「1枚の統計表を、読める地図へ」。
数字の正確さは保ったまま、スクロールするだけで構造が腹落ちする体験にする。

制作プロセス:Claude Opus 4.8 をどう使ったか
ざっくり言うと、PDFの構造化 → ナラティブ設計 → 実装の各段階で Claude Opus 4.8 を使いました。

  1. データ抽出:PDFの各表(第2表〜第9表、付表ほか)から数値を読み取り、扱いやすいデータ構造に整理。表ごとに「何が主役の数字か」を言語化させる。
  2. ナラティブ設計:単に全グラフを並べるのではなく、各セクションに「一番伝わる1文」を持たせる構成にしました。たとえば学歴のセクションなら「大学院卒は高校卒の1.7倍」のように、最初に結論となる数字を立てる。
  3. 実装:スクロール連動のセクション、グラフ、都道府県のタイルマップ、3言語の文言出し分けまでを生成・調整。

ポイントは、Opus 4.8 が**「数字の正確さ」と「物語としての分かりやすさ」を両立させやすい**ことでした。各セクションのコピー(見出しやリード文)も、データの含意を外さずに書けるので、可視化と文章を行き来する作業が一気通貫でやれます。
工夫したところ

平均の罠を可視化する構成:「平均340,600円」をまず提示し、その後で性別・地域・雇用形態に分解して「平均は誰の実感とも一致しない」を体感させる流れにした。
タイルマップ:都道府県差は正確な地理より「東京が突出/全国平均超えは4都府県だけ」という構造が伝わることを優先し、簡略化したタイルマップにした(この点はサイト内に注記)。
出典の明記:可視化目的の非公式な再構成であることと、厚労省の出典リンクを明示。政府統計を扱うときの最低限のマナーとして。

元データの主要数値(メモ)

平均所定内給与(男女計): 340,600円/月(前年比+3.1%、過去最高)
男性 373,400円/女性 285,900円(男=100で女76.6)
中位数(男女計): 296,600円
調査対象: 常用労働者10人以上の民営事業所 52,242事業所/有効回答率75.4%

まとめ

政府統計PDF × LLM は、「正確だが読みにくい一次情報」を「正確で読みやすい体験」に変える相性のいい組み合わせだと感じました。次は別の統計(家計や物価など)でも同じ手法を試してみたいです。

ソースや手法について質問があればコメントどうぞ。

image.png

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?