問題
20XX年、警視庁に勤めるあなたのもとに、とあるAI開発会社のセールスマンがやってきてこう言った:
「東京が超監視都市になって久しいものです。今や至る所に監視カメラがあって、東京に居て監視カメラに顔を映さない人など存在しないでしょう。そう、それが犯罪者であってもです。監視カメラが映す1000万人の市民の顔を、もっと有効活用しませんか?そしてそれには弊社で作ったこの犯罪者識別機を使えばよいのです」
「あらかじめインプットしておいた100人の指名手配犯の顔が監視カメラに一度でも映れば、この犯罪者識別機が即座に識別して教えてくれます。あなたたちの仕事は、この識別機が教えてくれた場所に行って指名手配犯を捕まえるだけでよいのです。もう東京に犯罪者は住めなくなりますよ」
「識別機の精度ですか?私共も誤認逮捕だけはごめんですからね、精度にはこだわりましたよ。弊社の技術を駆使して、なんと99.9%の精度で正しく識別できるところまで実現しました。これで誤認逮捕はほぼないでしょうね」
1000万人の中から指名手配犯100人を99.9%の精度で自動的に見つけてくれる機械。一見魅力的に思えるが、本当にそうだろうか?
回答
犯罪者識別機に「この顔を持つ人物は指名手配犯である」と識別された人が、本当に指名手配犯である確率を計算する。
\frac{100 \cdot \frac{999}{1000}}{100 \cdot \frac{999}{1000} + 9,999,900 \cdot \frac{1}{1000}} = 0.0098912 \dots
つまり、この犯罪者識別機によって犯罪者認定された人は、99%以上の確率で犯罪者ではない。とんでもないポンコツを掴まされそうになっていたのだ。
じゃあどれほどの精度があれば十分なのか
犯罪者識別機が「この顔を持つ人物は指名手配犯である」と識別された人が、本当に指名手配犯である確率が99.9%になるための精度を計算する。以下の$p$に関する不等式を解けばよい。
\begin{align}
&\frac{100 p}{100 p + 9,999,900 (1-p)} > 0.999, \\
\therefore \ &p > \frac{9989900100}{9989900101} = 0.99999999999899898898888988991092224246575706773837932867
\end{align}
とんでもない精度が求められる。