推薦システムや情報検索は、スコア付けが指標(例えば関連性)に基づいて最適化され、そのうえで出力されるという共通点がある。複数の指標から一つを選び出したり、重み付けしたりする場合は、本質的に政治的に選ばざるを得ないのではないかと思ったので脳内のことを吐き出す。(つまり、これを「科学」と称することが可能なのかについての思考実験)
定式化
- 負の相関を持つ2つの指標 $A, B$ がある。
- スコアを付けたい対象 $V$
- 検索や閲覧などの操作 $W$
- あるパラメータ $\alpha$
- $Y=f(V,W,\alpha)$ で各要素にスコアが付けられる。
- $V$ と $W$ の要素は $d$ 次元のベクトルと考える。
- $Y$に基づいてソートした順序 $g(Y)$ がある。
- 指標 $A$ で評価した時、$Z_{A}=h(g(Y),A)$で表すとする。同様に$Z_{B}$も表せる。
- $\alpha$が増加すれば$Z_{A}$は増加。
- $\alpha$が減少すれば$Z_{B}$は増加。
このとき、$f$ を決定する「合理的な」方法を見つける。
絶対優位
2つの関数$f_1, f_2$があるとき、$V,W$固定と考え、$\alpha$がいかなる値でも、$f_1(\alpha)_A > f_2(\alpha)_A$, $f_1(\alpha)_B > f_2(\alpha)_B$となれば$f_1$が優れていると考える。これを一つの合理性と考える。
単一指標$A$において評価$f,g$があるとし、$g(x)=1-0.5, f(x)=1-x$と比較する時、$x \in [0,1]$において$g$は$f$と比較した時に絶対優位となる。
指標$B$を追加した時、この評価は$g(x)=0.5x+0.5, f(x)=x$で、$x \in [0,1]$範囲で$g$は$f$と比較して絶対優位。$g = (g_A, g_B) = (1-0.5x, 0.5x+0.5)$, $f=(f_A, f_B)=(1-x, x)$で、それぞれの指標$A,B$内で比較した場合は$g$が$f$に対して絶対優位。
絶対優位にならない場合
$g = (g_A, g_B) = (1-0.5x, x)$, $f=(f_A, f_B)=(1-x, 0.5x+0.5)$という具合にBにおける関数を入れ替えたものを用意すると絶対優位とはならない。そこで、それぞれの指標に対する$x \in [0,1]$における重み付け和によって不等式を考える。
\int_{0}^{1}(a(-x+1)+b(0.5x+0.5))dx < \int_{0}^{1} (a(-0.5x+1)+bx)dx
するとこの解は、$b < a$となる場合にこの不等式が成り立つことになる。不等式が逆になれば、$a < b$となる。言い換えれば、$a < b$とは「一方の指標がもう一方よりも重要だ」と決めつけるのと同じである。
重みを決めることは政治?
AとBを目的と呼ぶとする。一度単一の目的が選ばれれば、それを最大化・最小化する形の問題になる。ところが目的が複数ありえて、その中から一つの目的を選び出すか、または重み付けする場合、何らかの「政治」が仮定されなければ、目的や重みを選べないのではないか、というのがここでの問いである。
例1: 検索エンジン
検索エンジンは「レイターガイドライン」を公開している。
https://support.google.com/websearch/answer/9281931?hl=ja
検索エンジンは政治をアルゴリズムで正当化している可能性はあっても、「科学」ではないかもしれない。このガイドライン自体はどのように作成されただろうか。ガイドラインを作成する行為を、純粋な科学だけで決定できただろうか。
(蛇足だが、パレート効率性や功利主義といった基準をガイドラインに組み込める可能性があるが、SEO業者のハックに対応するための改善はSEO業界への不利益を前提にするのでパレート改善とはならないので、現実の検索エンジンは功利主義に近いかもしれない。どちらにしてもこれらは政治である。)
例2: ビジネス目的
ステークホルダーに広告プロバイダーとユーザーがいるとする。この2者の利益は一般的に相反することがある。どちらのステークホルダーを優先するかについて重みを決める科学的な方法があるだろうか。
これに対して「利潤に基づいて最適化すれば重みが決まる」と言う人もいるだろうが、利潤という上位目的は、単純な例ではCSRや利潤に対して何かしらの重み付けをされているのではないだろうか。上位目的の重みはどのように決定されるだろうか。(利潤が最大化できるなら詐欺広告を表示しても良い、というのと、倫理的にダメなものは排除した上での利潤最大化と言うのとでは違う。)
あるいはこれをずっと繰り返していって、政治ではなくなる最上位目的はあるだろうか。独裁制、投票といった別の仕組みが最後に必要になるとして、それは科学ではなく政治ではないだろうか。
例3: 人事AIのアノテーション
「優秀な人材が欲しい」といった目的で、社員の情報とパフォーマンスを関連付けてアノテーションし、それを学習させたモデルで雇用時に使うとしよう。パフォーマンスを科学的に一意に決定する絶対基準はあるだろうか。実際はそんなものはなく「俺達がパフォーマンスだと考えるもの」を指標とする。この指標を決める段階で、すでに政治が起きているのは言うまでもない。
そしてそれは単なる偏見ですらある。もし過去に女性のパフォーマンスを低いと偏見でみなしていたなら、モデルはその偏見の代弁者になる可能性が高い。これを「科学」などと言うことはできない。アルゴリズムというものは崇高でもなんでもなく、意見をモデルに挿入したものである。
例4: イイネの仕組み
ソーシャルメディアがイイネの数(これも重みと考えることが可能)を利用してTopに表示されるものを決めるとする。これは好き嫌いの集合、あるいは投票であり、投票とは政治である。イイネの数による決定は科学でもないし「絶対的価値」を表しているわけでもない。(これを絶対的価値とみなすのは社会構築主義者)