はじめに
最近 Kaggle でも AI Agent / Agentic AI の応用が盛んになってきました。
沖縄Kaggler会 や Claude Code と Codex でほぼコードを書かずに Kaggle 金メダルを取った話 で話題になったように、Claude Code の応用事例が増えています。
「人間がアイデアを生成・検証し、AI が実装・分析を担当する」が最適な分業
これを読んで「Kaggle以外の現実のデータ分析でも同じことができるのでは?」と思い、個人的にやりたかった分析に Claude Code を投入してみました。
テーマは警察庁の交通事故統計オープンデータ。「2030年に交通事故死者半減、2050年にゼロ」という目標に対し、現行 ADAS (Advanced Driver-Assistance Systems, 先進運転支援システム) によってどこが介入空白となっているのかを探りました。
この記事では分析の中身と、Claude Code を使って気づいたこと・気をつけたことの両方をレポートします。
想定読者
- Claude Code を使ったデータ分析に興味がある方(初心者)
- モビリティ・交通安全領域のデータサイエンスに関心がある方
使用データ
- 2020年本票(309,178件 / 死亡2,784件)
- 2024年本票(290,895件 / 死亡2,598件)
- 出典:警察庁 交通事故統計オープンデータ
1. 分析設計
はじめに掲げた問い——「現行ADASはどのパターンがカバーできていないのか」——を具体的な分析ステップに落とし込むにあたって、Claude Code と設計を詰めました。設計はこうなりました。
| Step | 内容 | 詳細 |
|---|---|---|
| 1 | 目標に対する現在地を確認する | → 2節 |
| 2 | 死亡負担が集中するシナリオを特定する | → 3節 |
| 3 | 停滞シナリオに絞ってパターンを探索する | → 4節 |
| 4 | 構造的課題を整理する | → 5節 |
| 5 | 介入の方向性をマッピングする | → 6節 |
2. 目標の現在地
「どこが空白か」を探す前に、そもそも目標に対して今どこにいるかを確認します。
| 指標 | 2020年 | 2024年 | 変化 |
|---|---|---|---|
| 死亡事故件数 | 2,784件 | 2,598件 | -186件(-6.7%) |
| 全事故件数 | 309,178件 | 290,895件 | -18,283件(-5.9%) |
| 致死率(死亡/全事故) | 0.900% | 0.893% | -0.007pt |
「2030年に半減」の目標に対し、4年間で -6.7% は大幅な遅れです。目標達成には残り6年でさらに1,200名以上の削減が必要ですが、現行ペースでは到底届きません。
致死率の変化(-0.007pt)についてロジスティック回帰(2020 vs 2024、目的変数:死亡)を行うと OR=0.961、p=0.15 で統計的有意差なし。事故当たりの死亡リスクそのものは、この4年で有意には下がっていません。
なお、2020年はコロナ禍の緊急事態宣言により交通量が大幅に減少した年であり、2024年との比較にはモビリティ構造の変化という交絡が含まれます。ADASの普及効果なのか、外出・移動パターンの正常化なのかを分離することは、本分析の範囲では困難です。
3. 効果あり/効果なしの明暗
「全体 -6.7%」という数字の内側に、大きな「明暗」があります。死亡負担が集中しているシナリオと、削減が進んでいる・いないシナリオを分けて把握することが目的です。事故を類型(人対車両・車両単独・車両相互)× 速度帯 × 昼夜 でセグメント分けし、2020→2024のトレンドを可視化しました。
削減が進んでいるシナリオ
車両単独×昼間×高速(>60km/h): 327件 → 263件(-64件、-20%)。郊外の高速走行域では着実に件数が減っています。この領域のサポカー普及率(2024年全事故ベース)は 6.3% と、全シナリオで最高水準にあります。AEB が機能しやすい条件(前方障害物・一定速度での走行)が揃っている領域です。
停滞・増加しているシナリオ
- 人対車両×夜間×低速(≤40km/h): 475件 → 483件(+8件、+1.7%)。全シナリオ最大ボリュームで、ほぼ横ばいが続いています。普及率は 5.0% です。
- 車両単独×昼間×低速: 151件 → 168件(+17件、+11%)。市街地での単独事故増加で、ペダル踏み間違い等が疑われます。この領域の普及率は 3.7% と、全シナリオで最低クラスの「空白地帯」となっています。
- 車両相互×昼間×中速: 34件 → 43件(+9件、+26%)。
まとめ
高速域・郊外での削減を、夜間×市街地×低速の停滞と市街地単独事故の増加が相殺しています。これが「全体 -6.7%」の正体です。データで見ると「普及が進んでいる領域で削減が進み、普及が遅れている領域で停滞・増加している」という明確なコントラストが見て取れます。
4. ADAS が届かない場所を探す
「サポカーが増えればこの停滞シナリオも改善するはず」という仮説を確認するため、3節で特定した停滞シナリオ(人対車両×夜間×低速)に絞り、サポカーと非サポカーで相手当事者B(歩行者等)の死亡率(B死亡件数/事故件数)に差があるかを探索しました(N=6,515、対象外除く)。
サポカー4.48% vs 非サポカー3.73%——このシナリオに絞っても、サポカーの方が相手当事者Bの死亡率が高いという逆説的なパターンが確認されました。ただしサポカー側N=290と少なく、信頼区間は広めです。
この結果には複数の解釈があります。
仮説1(残存事故バイアス): AEB が「防げる軽微な事故」を統計から除いた結果、残った事故が「センサー限界を超えた高エネルギー衝突」や「複雑な夜間シーン」に偏り、見かけ上の致死率が上昇しているという説です。これはウォールド(Abraham Wald)の「帰還した爆撃機の弾痕だけを補強した」生存者バイアスと同じ構造です。AEB が介入できた事故は統計から消え、「AEB をもってしても止まれなかった事故」だけが残る——残ったデータが重篤に偏るのは必然です。
仮説2(走行環境の交絡): サポカーは相対的に高価であり、高速道路や郊外走行の割合が高い可能性があります。また車種・重量差が致死率に影響している可能性もあります。
横断面データでは仮説を区別できません。差の方向だけで「AEBが効いている」「効いていない」を断言することは原理的に不可能です。
交絡制御:ロジスティック回帰の結果
単純な致死率比較では走行環境の違いが混入する可能性があります。夜間・地形・天候・高齢者フラグを共変量に加えた多変量ロジスティック回帰で、交絡を制御した上でサポカーの効果を確認します(N=253,832、対象外除く、目的変数:相手当事者Bの死亡)。
| 変数 | OR | 95%CI | p値 |
|---|---|---|---|
| サポカー(対非サポカー) | 1.730 | [1.418, 2.111] | <0.001 *** |
| 夜間 | 2.881 | [2.470, 3.361] | <0.001 *** |
| 非市街地 | 2.328 | [1.960, 2.764] | <0.001 *** |
| 雨雪 | 0.797 | [0.652, 0.974] | 0.027 * |
| 高齢者(65歳以上) | 0.860 | [0.731, 1.012] | n.s. |
夜間・地形を制御してもサポカーのORは1.730で有意に残ります。ただしこのORを「サポカーが相手を死なせやすい」という因果効果として解釈することは適切ではありません。今回のモデルに投入できた共変量(夜間・地形・天候・高齢者)は交絡の一部にすぎず、最もクリティカルな車両年式と車両重量が入っていないからです。サポカーは新しい車であり、新しい車はADASだけでなくパッシブセーフティ(衝突安全ボディ等)の性能も高い——「新しくて重いSUVだから衝突エネルギーが大きい」という物理的交絡が残存している可能性があります。OR=1.73 は「モデルの不十分さが残っている」と読むのが正確で、因果推論として成立させるには車種・年式の固定効果導入や傾向スコアマッチング(PSM)が必要です。
なぜ歩行者事故は特に難しいのか
車対車の事故であれば、相手もサポカーなら双方向から回避できる可能性があります。しかし対歩行者の場合、歩行者側にはADASがありません。車のAEB一本頼みで、しかも夜間の急横断ではセンサーが間に合わないケースが残ります。
物理的に整理すると明確です。40km/h走行時の全制動距離は反応時間(約0.75秒)+AEB制動距離を合わせて約17m。一方、夜間における歩行者のAEB検知距離は世代・照明環境によっては20〜30m程度まで低下し、駐車車両の陰から急横断されると検知から衝突まで数秒もない。「低速だから止まれる」は誤解で、夜間×急横断の組み合わせではAEBが物理的に間に合わないシナリオが残り続けます。
ADASが普及しても「人対車両×夜間」が減りにくい構造的な理由がここにあります。
つまり対歩行者では、新車のActive Safety強化(AEB・ADB)、衝突後のダメージ軽減(Passive Safety)、既販車へのADAS普及(レトロフィット)、インフラ整備と迅速救急を組み合わせる多層アプローチが必要です。各層には必ず穴(限界)がありますが、複数重ねることでリスクを抑えるスイスチーズモデルの考え方です。
ただし車両側の技術介入(Active Safety・Passive Safety・レトロフィット)は新車普及や既販車への後付けに依存する部分が大きい。現在の死亡事故における非サポカーの割合はどれくらいで、自然更新を待てば解決するのか——次節でこの構造問題を確認します。
5. 新車普及を待てば解決するのか
「ADASは新車に搭載されているから、車の入れ替えが進めば自然解決するのでは?」という楽観論があります。
これへの答えは、2020→2024の実績そのものが持っています。この4年間は新車ADAS普及が進んでいた期間でもあります。その効果が織り込まれた上での実績トレンドは -46.5件/年。それをそのまま延長すると…
2030年に約2,319名。目標1,392名まで 約927名の「死のギャップ」 が残ります。
「自然更新が進めば解決する」は、すでに起きているADAS普及の効果を見ても成立しない、というのがデータの答えです。
2024年時点でも死亡事故の加害車両の 91.3%(四輪当事者A)は非サポカーです。フリートの入れ替えには時間がかかる、という現実が重くのしかかります。
6. 介入の方向性
4・5節で「ADASが届かない構造」と「自然更新では間に合わない現実」が確認できました。これを踏まえ、2030年目標に向けた具体的な介入の方向性を整理します。WHO・OECDが提唱する Safe System Approach の考え方を念頭に、車両・道路・ユーザーの各層にまたがる介入を整理します。
- Active Safety(新車): 夜間・歩行者検知の強化(夜間×歩行者×低速で254名の死亡負債を抱える最大シナリオへの直接介入)。AEB による衝突回避に加え、自動防眩ハイビーム(ADB)による早期視認も同じ夜間×歩行者に作用する。AEBが「検知してから止める」のに対しADBは「視認して避ける」前段階であり、両者は相互補完的なActive Safety技術です。
- Passive Safety(被害軽減): AEB で防ぎきれなかった衝突の致死ダメージを物理的に下げる技術。
- レトロフィット(既販車): 普及率3.7%に留まる市街地・低速域の非サポカーに対し、後付け装置で2030年までの時間ギャップを埋める。
- インフラ・救急システム: 生活道路の物理的減速(ゾーン30プラス:警察庁実績で死亡事故38.9%減)、eCallによる救急迅速化で、当たっても「死なせない」体制を整える。
- 人の能力向上(啓発・教育): 高齢ドライバーの免許返納促進、夜間歩行者への反射材着用啓発、ながら運転防止など。技術介入と異なり効果の定量化は難しいが、Safe System Approach では不可欠な柱であり、他の4つと組み合わせることで相乗効果が生まれる。
自然更新(買い替え)だけに頼るのではなく、普及率の「空白地帯」に対する能動的な介入こそが、2030年半減への最短ルートです。
7. データの限界と今後の展望
ここまでの分析は警察庁統計(事後記録)だけで行いました。この選択がどんな限界を生み、本当に知りたいことに答えるには何が必要かを整理します。
このデータで「答えられなかった問い」
今回使用した警察庁統計(NPA)は「事故が発生した記録」のみを収録しています。「AEB が作動し、事故を防いだ件数」は記録されないため、「どのシナリオで ADAS がカバーできていないか」を横断面データから直接測定することは不可能です。今回の分析が示せたのは「死亡負担がどこに集中しているか」と「残存事故のパターン」であり、ADASカバレッジそのものではありません。
もう一つ構造的な問題があります。今回の主要指標「死亡率(死亡件数/事故件数)」は、AEBが普及する世界では評価指標として成立しない可能性があります。AEBが軽微な事故を防ぐと分母(事故件数)が減り、残存する事故の死亡率が上昇します。つまりAEBが効けば効くほど、見かけ上の死亡率が上がりうる。4節で「サポカーの方が致死率が高い」という逆説が出た背景にもこの構造が絡んでいます。真の効果を測るには「走行距離あたりの死亡率」や「AEB作動ログを分母とした指標」への再定義が必要です。
本当に必要なデータ
この限界を超えるには、市場走行データ(コネクテッド車両)との連携が必要です。
- AEB 作動ログ × シナリオ(夜間・歩行者・低速)のクロス集計: 「どのシナリオで作動しているか」が初めて直接測定できる
- ヒヤリハット地点のマッピング: 急ブレーキ・急操舵のテレマティクスデータから、事故が「起きる前」に危険箇所を特定できる
- 走行距離あたりの ADAS 作動率: 「死亡事故率」ではなく「防いだ事故数」で ADAS 効果を評価できる
Claude Code との作業フロー
実際にやったこと
- 約30万件の CSV を読み込み、セグメント集計・統計検定・図表生成・PDF出力を Python で実装
- 分析設計(RQ の定義・統計手法の選択)を Claude Code と対話形式で進めた
今回は素の Claude Code(CLAUDE.md もカスタム Skills も未設定)で進めました。プロジェクト固有のコンテキスト(データ定義・分析方針・用語集)を CLAUDE.md に書いておけば毎回説明し直す手間が省けますし、繰り返し使う分析パターンを Skills として登録しておけばさらに効率が上がりそうです。次回以降の課題です。
感じた価値と限界
価値はコード実装の速度です。「ロジスティック回帰で交絡制御したい」と伝えると、statsmodels で動くコードをすぐに返してくれます。反復的な試行錯誤が速くなる感触がありました。
一方で、分析の解釈の責任は人間にあります。今回の作業中に「残存バイアスがある = AEB が効いている」という誤った解釈がコードのコメントに紛れ込んでいることに気づきました。生成された結果を「実行して信じる」だけでは不十分で、統計的な妥当性のレビューは必須です。LLMは相関と因果を混同しやすいです。今回もその一例に実際に遭遇しました。少なくとも今の時点では、因果の構造を見極める作業は人間がレビューする必要があると感じました。
分析設計(RQ・手法・解釈)は人間、実装(コード・図表・レポート)は Claude Code、という分業は機能しました。DS の仕事は「どのデータをどう組み合わせて何を問うか」の設計に集中できるようになる感触があります。
おわりに
今回の分析でわかったことをまとめます。
- 2020→2024で -6.7%。「2030年半減」には大幅に遅れている
- 削減が進んでいるのは「高速×郊外×車両単独」、停滞しているのは「低速×夜間×歩行者(市街地)」
- 夜間×歩行者の停滞は残存事故バイアス仮説と整合するが、横断面データでは因果を特定できない
- 2024年の死亡事故加害車両(四輪)の91.3%は非サポカー、自然更新では2030年目標に届かない
- NPAデータには「防いだ事故」が存在しない、本当のADASカバレッジは走行データとの連携でしか測れない
- 「死亡率(死亡/事故件数)」はAEB普及世界では指標として成立しない——AEBが効くほど分母が減り見かけ上の死亡率が上昇する構造があるため、真の効果測定には走行距離ベースへの指標再定義が必要
「交通事故死者ゼロ」への道は、事後統計の分析に留まらず、市場走行データと事故統計を連携させ、ADAS の効いていない場所を直接可視化するデータドリブン開発の中にあると考えています。
おまけ
冒頭で紹介した記事によれば、Claude Code の自律度は米自動車技術会(SAE)の自動運転レベルで言うと L3〜L4 の間あたりだということです。「ハンズオフ・アイズオフは可能だが、最終的にはドライバー(サイエンティスト)が責任を持つ」——今回の経験からも、これはその通りだと感じました。
今後、L4〜L5 相当の Science Agent が台頭してきたら、私たちの役割はどうなってしまうのでしょう?
Kaggle は問いも評価指標もデータもあらかじめ定義されています。でも実際の分析では「何を問うか」「どのデータを集めるか」「何で成功を測るか」を自分で決めなければなりません。L5 の完全自律運転でも、目的地を告げるのは人間です。分析の目的を決めるのも同じで、そこは最後まで人間の仕事だと思います。
仮説を立てる人、問いを設計する人、データを集める人、評価指標を定める人、解釈や結果に責任を持つ人、意思決定をする人——そのあたりが最後まで残るポジションで今後さらに重要性が増していく気がしますが、それも含めてデータ分析が民主化されていく過程を楽しみたいと思います。
※ Claude Code以外だと、Andrej karpathy の autoresearchがバズったりしてましたね。
(コラム)2030年半減目標——何でどれだけ削減できるのか
2024年実績(2,598名)から2030年目標(1,392名)へ、1,206名の削減が必要です。警察庁データと ITARDA 実測値を使って、施策別に「どこまで届くか」を試算しました。
Step 1:ADASは死亡事故の構造とどう噛み合っているか
非サポカー加害車両が関与する死亡事故(2024年・推計1,986名)を事故類型で分解し、ITARDA No.133 の実測効果率を掛けました。
| 事故類型 | 死亡数 | ADAS効果率 | 削減推計 | 根拠 |
|---|---|---|---|---|
| 人対車両×夜間 | 538名 | 21.8% | 117名 | ITARDA No.133実測 |
| 車両単独(逸脱・転倒) | 480名 | 20.0% | 96名 | 欧州LKA/DMS参考・仮定値 |
| 人対車両×昼間 | 257名 | 17.6% | 45名 | ITARDA No.133実測 |
| 出会い頭 | 700名 | 6.5% | 46名 | ITARDA No.133推計 |
| 合計(上限) | 1,986名 | 15.4% | 305名 |
AEBが最も得意な「追突」では死亡事故がほぼ発生しない(追突の死亡はほとんど A 側のみで B 死亡≈0)。死亡事故の主体は歩行者と出会い頭——ここでは AEB の効果が限定的で、これが ADAS の構造的な上限です。
Step 2:レトロフィット普及率を上げても届くのか
| 普及率 | ①ADAS削減 | ②高度AEB義務化 | ADAS合計 | ギャップ比 | ⑥自然更新(279名)差引後の残り必要数 |
|---|---|---|---|---|---|
| 50% | 153名 | 55名 | 208名 | 17% | 719名 |
| 100% | 305名 | 55名 | 360名 | 30% | 567名 |
※②高度AEB義務化:夜間×人対車両×低速(254名)× 21.8%(ITARDA実測)≈ 55名
100%普及でも30%止まり。 普及率の問題ではなく、効果率の壁が上限を決めています。
Step 3:全施策を積み上げると達成できるのか
(以下の施策番号①〜⑥は試算用の分類で、6節の方向性とは粒度が一部異なります。)
| 施策 | 対象 | 削減推計 | 根拠・前提 |
|---|---|---|---|
| ① ADAS レトロフィット(50%普及) | 非サポカー死亡1,986名 | 208名 | ITARDA No.133実測 + LKA/DMS欧州参考 |
| ② 先進ライト ADB普及(50%) | 夜間×人対車両 538名 | 54名 | IIHS:夜間歩行者事故最大20%削減、保守的に20%×50%普及(仮定値) |
| ③ パッシブセーフティ向上 | 全死亡事故 2,598名 | 130名 | 歩行者フード・乗員保護改善で致死率5%低下仮定 |
| ④ ゾーン30プラス全国展開 | 停滞シナリオ 795名 | 310名 | 警察庁実績:死亡事故38.9%減 |
| ⑤ eCall 義務化 | 全重傷事故 | 130名 | 欧州委員会:重傷者15%減を日本に保守適用 |
| ⑥ 自然更新 | 残存フリート | 279名 | 2020→2024実績トレンド(-46.5名/年)× 6年 |
| 合計 | 1,111名 | 必要1,206名の92% |
全施策を同時に積極展開すれば約92%まで届く計算です。ただし②③⑤は根拠が弱く実際は低い可能性があります。先進ライトを①のAEB(夜間21.8%)と重複しないよう独立計上しましたが、効果は一部重なります(国交省アセスメントも両者を別個評価)。
なぜゾーン30と先進ライトが「主役」になるのか
ゾーン30プラスは警察庁の全国2,490か所での実績で死亡事故38.9%減(全体平均10.4%減を大きく上回る)を示しています。対象となる死亡事故の主体——夜間×市街地×低速での歩行者795名——はAEBの苦手領域と完全に一致します。物理的に速度を下げることで、AEBが間に合わない急横断でも衝突エネルギーを下げられる。
先進ライト(ADB)も同じ夜間×歩行者538名に直接刺さります。歩行者死亡の約70%が夜間に発生しており(国交省)、ADBはAEBが「検知してから止まれない」ケースでドライバーが早期に歩行者を視認し回避できる可能性を高めます。AEBとADBは「検知してから止める」と「視認して避ける」で相互補完的です。
「サポカーの死亡率が高い」のに、なぜ削減できるのか——生存者バイアス
本文でも触れた逆説の答えです。AEB が事故を防いだ「成功例」は警察統計に一切記録されません。統計に残るのは、センサーの限界を超えた「失敗例」だけ。ITARDA No.133 はこれを保有台数あたりの事故件数比較で実証しています——AEB 装備車は非装備車に対し追突事故を 62.9% 少ない件数で起こしています。
「統計から消えた 62.9% 分の事故」を、非サポカーが支配的な現状フリートに適用することが ADAS の本来の力です。ただし死亡事故では歩行者・出会い頭が主体であり、そこでの効果は 7〜22% にとどまる——これが「レトロフィットしても30%止まり」の正体です。
(コラム)自動二輪車の死亡事故傾向
四輪の分析と同じデータで、自動二輪車(コード31〜35)のライダー死亡事故も確認しました。
2020年158件 → 2024年150件(-5.1%)と、四輪と同程度のペースで減少しています。
ただし事故類型の内訳が四輪とまったく異なります。
ライダー死亡の93〜95%が車両単独事故(転倒・単独衝突)で、四輪で問題になっている「夜間×歩行者」の構造とは別物です。ADASによる対人・対車両の衝突回避ではなく、ライダー自身のスキル・速度・路面状況が主な要因になるため、介入の方向性も異なります。
データ・コード
- データ: 警察庁 交通事故統計オープンデータ
- AEB効果分析参考文献: ITARDA インフォメーション No.133「軽乗用車の衝突被害軽減ブレーキ(AEB)の効果分析」(令和2年3月、公益財団法人 交通事故総合分析センター)
- 分析コード: GitHub(近日公開予定)
本分析は警察庁の交通事故統計オープンデータを独自に集計・加工したものです。記事内の解釈や考察は筆者個人のものであり、警察庁の公式見解ではありません。




