0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

人的資本開示を「義務」から「武器」へ。4000社のオープンデータを耕した「人的資本データnavi」の想い

0
Posted at

この記事は、2026年3月19日に開催された「データ界隈100人カイギ vol.4 オープンデータ会」での登壇内容を、Qiita用に記事としてまとめたものです。

はじめに

こんにちは、株式会社カオナビの本江(@Yuto_Hongo)です。

私は普段、社内のデータ基盤運用や活用を主軸とする「クローズドデータ」の世界で活動していますが、その一方で、有価証券報告書(有報)というオープンデータを活用したデータベースサービス「人的資本データnavi」の運営も行っています。

今、日本は人的資本開示の義務化によって、いわば**「オープンデータのゴールデンタイム」**を迎えています。しかし、多くの企業にとってこの開示は「義務を果たすための作業」に留まっているのが実情です。

私たちはこの状況を変え、データをより良い会社作りをするための**「武器」**に変えたいと考えています。本記事では、その想いと、4,000社のデータを収集・解析する技術的な裏側についてご紹介します。


1. なぜ今「人的資本」なのか?

世界的な投資の流れは、人を「コスト」ではなく「資本(価値の源泉)」と捉える方向へ劇的に変化しています。

  • 2021年: 岸田政権が「新しい資本主義」の柱に据える
  • 2023年: 内閣府令改正により、上場企業など約4,000社に有報での人的資本開示が義務化

これにより、女性管理職比率、男性育休取得率、男女間賃金差異といったデータが、すべての投資家や求職者にオープンになりました。まさに、データ活用側にとっては千載一遇のチャンスが到来しています。


2. 開示の現場を襲う「現在地がわからない」問題

しかし、いざデータが公開されても、企業担当者からは戸惑いの声が上がっています。

例えば、自社の女性管理職比率が「15%」と出たとき、担当者はこう悩みます。
「この15%という数字は、果たして誇れる数字なのか? それとも早急に改善すべき数字なのか?」

有報には自社の数字は載っていますが、「業界平均」や「競合他社の進捗」 を網羅的に把握する手段が乏しいため、自分たちの立ち位置(ベンチマーク)がわからず、適切な目標設定ができないのです。


3. 「人的資本データnavi」が解決すること

この「比較できない」という課題を解決するために立ち上げたのが、「人的資本データnavi」です。

  • 4,000社を網羅: 上場企業の開示情報をDB化
  • 誰でも無料: 特定の有償ツール不要。今すぐブラウザで確認可能
  • 直感的な比較: 業界平均や個別企業との比較、推移の可視化

「数字を出すだけで終わり」にするのではなく、他社と比較して「自社の強み・弱み」を正しく認識し、より良い組織を目指すためのスタートラインを作ることが私たちのミッションです。


4. 【技術深掘り】EDINETデータの「泥臭い」つらさとLLMによる攻略

ここからは、実際に約4,000社のデータをどうやって収集しているかという、技術的な苦労話です。

CSVデータの限界(項目がない・値が壊れている)

EDINETからはCSVも配布されていますが、実は**「任意の開示指標」については項目値が用意されていないケースが多々あります。また、最大の問題はデータの品質**です。

有報のシステム上、改行やスペースをトリムしてCSV化する際に、**「2つの数字がくっついてしまう(例: 10.5 12.0 → 10.512.0)」**といった現象が発生します。これを機械的に分離するのは、従来の形態素解析では非常に困難です。

PDF × LLM による構造化

そこで私たちは、CSVではなくPDFの原文をベースに、LLMを活用してデータを抽出するアプローチを採っています。特に苦戦したのが「セル結合された複雑な表」です。

LLMにそのまま表を投げても精度が出ないため、以下のような「AIに優しい前処理」を徹底しました。

  1. レイアウトの構造化: 表の構造(どこがどのセルの値か)を保持したままテキスト化。
  2. 正規化: セル結合部分を特定し、空セルをnullで埋めるなど、AIが文脈を読み取りやすい形に変換。
  3. プロンプトエンジニアリング: 「この表から特定の指標を抜き出せ」という命令を、構造化データに基づいて最適化。

AIだけでなく「人の目」でデータのチェックを実施

LLMによる自動化でコストと速度を大幅に改善しましたが、情報の正確性は譲れません。私たちは、AIによる抽出 → 専門スタッフによる全件目視チェック というフローを構築し、高い精度を維持しています。


5. おわりに:データを「武器」にした先の未来

データを公開することはゴールではありません。

  1. 現在地を知る(データ活用)
  2. 課題を見つける(目標設定)
  3. 施策を打つ(改善活動)
  4. より良い組織になる(アウトカム)

このサイクルを回すためのエネルギー源として、オープンデータは存在します。
「人的資本データnavi」が、より良い会社作りを目指す皆さんの背中を「ぽんっ」と押せる存在になれば幸いです。

これからも、誰もがデータを武器にできる世界を目指して、オープンデータを耕し続けていきます。


関連リンク

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?