はじめに
東京科学大学では、真のダイバーシティ&インクルージョンを実現するため、2024年度入試から「一般枠」と「女子枠」を設け、すべての学生が公平に学びの機会を得られる仕組みをスタートさせました。これは、女性が理系分野へ進む選択肢を広げる重要な一歩であり、これから理工系分野を志すすべての人に対し、高校レベルの数学・科学力が「特別なもの」ではなく「前提」であることを強く示しています。
数理的思考を軽視し、これまで続いてきた男性優位の枠組みに無批判に順応する態度は、格差を固定化し、未来を閉ざす行為に他なりません。
「知らない」「考えない」と立ち止まるのではなく、数学的・論理的な力を自らの武器として手に取り、不公正な構造に立ち向かう意志こそが、より良い社会を切り拓く鍵です。
1. 微分(変化率)の基礎理解
社会課題を「見える化」し、変化の大きさや傾向を定量的に捉えるために、数学の微分は非常に有効です。
1.1 微分の定義
微分とは「瞬間的な変化率」を表す数学的概念で、次のように定義されます。
$$
\frac{dy}{dt} = \lim_{\Delta t \to 0} \frac{y(t + \Delta t) - y(t)}{\Delta t}
$$
ここで
- $y(t)$ は時間 $t$ における指標(例えば男女賃金格差)
- $\Delta t$ は時間の変化量
- $\frac{dy}{dt}$ はその時点の変化率
つまり、**「次の瞬間どれだけ変わるか」**を示すのが微分です。
1.2 離散データでの近似(実データへの応用)
現実の社会データは連続ではなく、年ごと・月ごとといった離散的なデータとして得られます。
この場合、以下の差分近似が使われます。
$$
\frac{\Delta y}{\Delta t} = \frac{y_{i+1} - y_i}{t_{i+1} - t_i}
$$
例えば、
- $y_i$ が2023年の男女賃金格差
- $y_{i+1}$ が2024年の男女賃金格差
であれば、その変化率は
$$
\frac{y_{2024} - y_{2023}}{1}
$$
となり、プラスなら「格差拡大」、マイナスなら「格差改善」と解釈できます。
1.3 増加・減少傾向の読み取り
変化率が
- 正なら「拡大傾向」
- 負なら「改善傾向」
を意味します。
また、**変化率の大きさ(絶対値)**が大きいほど、社会的インパクトも大きいと考えられます。
例えば、
- 変化率 $+0.1$ なら「緩やかな拡大」
- 変化率 $+1.5$ なら「急激な拡大」
と読み取り、政策議論や対策立案の優先順位付けに活用できます。
2. 積分(累積量)の考え方
「変化率」だけでなく、これまでに蓄積されてきた総量も重要です。
それを捉えるのが積分の役割です。
2.1 積分の定義
積分は、変化の「積み重ね」を表します。
$$
\int y(t) , dt
$$
これは、時間を通じて積み上げられてきた「歴史的格差総量」や「累積的な影響量」を表現します。
2.2 実データへの応用
例えば、過去10年間の賃金格差データを年ごとに足し合わせていくと、
$$
S = \sum_{i=1}^{10} y_i \times \Delta t
$$
続きとして、実データから回帰モデルを作成し、積分を使って社会全体への累積影響を評価する手順を解説します。
2.3 回帰モデルによる格差の数学的モデル化
実データが年ごとの賃金格差データ $(t_i, y_i)$ で与えられているとします。
このデータをもとに、多項式回帰を適用し、時間 $t$ に対する格差の数理モデルを次のように構築できます。
$$
y(t) = a_0 + a_1 t + a_2 t^2 + \dots + a_n t^n
$$
ここで、
- $a_0, a_1, \dots, a_n$ はデータに基づき算出される係数
- $n$ はモデルの次数(例えば2次なら放物線モデル)
2.4 モデルから累積格差を積分計算
このモデルに基づく累積格差 $S$ は、ある期間 $t_0$ から $t_1$ までの積分として次のように求められます。
$$
S = \int_{t_0}^{t_1} \left( a_0 + a_1 t + a_2 t^2 + \dots + a_n t^n \right) , dt
$$
積分結果は、
$$
S = a_0 (t_1 - t_0) + \frac{a_1}{2}(t_1^2 - t_0^2) + \frac{a_2}{3}(t_1^3 - t_0^3) + \dots + \frac{a_n}{n+1}(t_1^{n+1} - t_0^{n+1})
$$
2.5 フェミニストのための線形回帰と勾配法
― 社会的不平等をデータに基づいて是正するために ―
■ 構造的不平等を数理モデルで捉える
賃金格差、昇進機会の不平等、教育格差…。
これらは偶然や個人差ではなく、社会構造の歪みに起因する「説明可能なパターン」であると捉え直すことが必要です。
たとえば、男女間賃金格差を説明する直線モデルは次のように表せます。
$$
\text{Wage} = w \times \text{Years_Experience} + b
$$
ここで、
- $w$ は経験年数による昇給率
- $b$ はスタート地点での賃金(構造的不平等が現れる可能性)
例:女性だけスタート地点が低い
スタートラインで既に不利な位置に置かれている社会的構造を、この数理モデルで明示化します。
■ 不平等是正に向けた勾配法の意義
損失関数 $L(w, b)$ を社会格差の指標とみなし、
これを「是正」に向かわせるプロセスが**勾配法(Gradient Descent)**です。
$$
w \leftarrow w - \eta \frac{\partial L}{\partial w}
$$
$$
b \leftarrow b - \eta \frac{\partial L}{\partial b}
$$
解釈:
- $w$の更新:経験や実績による評価のバランス是正
- $b$の更新:初期設定(スタート地点)の不平等解消
2.6 フェミニストのためのヘッセ行列微分入門
― 構造的不平等を「曲率」で読み解く ―
1. ヘッセ行列とは?
ヘッセ行列(Hessian Matrix) とは、多変数関数の「すべての2階偏微分係数」を並べた二階微分行列です。
数式表現(2変数関数の場合)
数式表現(2変数関数の場合)は次のようになります。
2変数関数 $f(x, y)$ のヘッセ行列
- $\frac{\partial^2 f}{\partial x^2}$:x方向の2階微分(xの変化に対する変化率)
- $\frac{\partial^2 f}{\partial y^2}$:y方向の2階微分(yの変化に対する変化率)
- $\frac{\partial^2 f}{\partial x \partial y}$ と $\frac{\partial^2 f}{\partial y \partial x}$:xとyの相互作用(クロス効果)
2. 社会格差の「曲率」解析に応用する視点
項目 | 社会的意味付け |
---|---|
1階微分(勾配) | 変化の方向・大きさ:格差が拡大か縮小か |
2階微分(ヘッセ行列) | 変化の「曲がり方」「加速」「反転」の特性:政策の安定性・効果の限界・反作用 |
ヘッセ行列はニュートン法や**準ニュートン法(BFGSなど)**に用いられ、より速く・安定的に最適解へ到達する手段として活用されます。
3. 男女格差をモデル化するための数理モデル・関数一覧
3.1 線形モデル(Linear Function)
-
モデル式
$$
y(t) = a t + b
$$ -
意味
格差が年ごとに一定の割合で拡大または縮小するモデル。 -
適用例
年単位でほぼ直線的に変化している賃金格差や管理職比率の推移。
3.2 二次関数モデル(Quadratic Function)
-
モデル式
$$
y(t) = a t^2 + b t + c
$$ -
意味
格差の加速的拡大または改善を表現。 -
適用例
政策介入や社会運動によって変化の速度が変わる局面のモデル化。
3.3 指数関数モデル(Exponential Function)
-
モデル式
$$
y(t) = a e^{b t}
$$ -
意味
初期は小さく、徐々に急激に拡大・縮小する格差を表現。 -
適用例
技術革新や社会変革の影響で一気に格差が拡大・是正される場面。
3.4 ロジスティック関数(Logistic Function / S字曲線)
-
モデル式
$$
y(t) = \frac{L}{1 + e^{-k(t - t_0)}}
$$- $L$ : 最大値(格差の限界)
- $k$ : 変化速度
- $t_0$ : 変化の中心時点
-
意味
限界(上限・下限)を持ちつつ、拡大や是正がS字型で進む。 -
適用例
法制度や社会意識改革による段階的な格差是正プロセス。
3.5 周期関数(Sinusoidal Function)
-
モデル式
$$
y(t) = A \sin(B t + C) + D
$$ -
意味
周期的に揺れ動く格差の傾向。 -
適用例
景気変動や政治的状況によって増減を繰り返す男女格差。
3.6 回帰分析におけるノイズの説明
回帰分析では、**ノイズ(誤差項)**とは「説明できない変動」や「モデル外の影響」を意味します。モデルが観測データにどれだけフィットしているか、またどの程度の“ばらつき”があるかを把握するために重要です。
■ 数式での定義
単回帰モデルの基本形:
$$
y = ax + b + \varepsilon
$$
ここで:
- $y$:目的変数(出力)
- $x$:説明変数(入力)
- $a$:傾き
- $b$:切片
- $\varepsilon$(イプシロン):ノイズ(誤差項)
■ ノイズの意味
- $\varepsilon$ は「モデルでは説明できない要因によるばらつき」。
- 実データにおける測定誤差や未知の変数の影響、環境要因などが含まれます。
■ ノイズの性質(仮定)
回帰分析では、以下のような仮定がされることが多いです:
-
平均がゼロ:
$$
\mathbb{E}[\varepsilon] = 0
$$ -
分散が一定(等分散性):
$$
\text{Var}[\varepsilon] = \sigma^2 \quad (\text{定数})
$$ -
独立性:
各データ点の誤差は互いに独立。 -
正規分布(特に最小二乗法の信頼性向上のため):
$$
\varepsilon \sim \mathcal{N}(0, \sigma^2)
$$
■ ノイズがあるときの回帰の解釈
- モデルが完璧にデータを説明できなくても良い。
- ノイズによるばらつきが小さいほど、モデルの予測精度が高い。
- 残差(実測値と予測値の差)はノイズの観測的近似である。
■ ノイズの可視化
実データにおいては、残差プロットなどを用いてノイズの分布や特性を確認します。
おまけ男女格差AI分析に用いられる代表的活性化関数一覧
活性化関数名 | 数式表現 |
---|---|
ステップ関数 (Heaviside Step) | $f(x) = \begin{cases} 0 & x < 0 \ 1 & x \geq 0 \end{cases}$ |
シグモイド関数 (Sigmoid) | $f(x) = \frac{1}{1 + e^{-x}}$ |
ReLU (Rectified Linear Unit) | $f(x) = \max(0, x)$ |
Leaky ReLU | $f(x) = \begin{cases} x & x \geq 0 \ \alpha x & x < 0 \end{cases}$ |
tanh(双曲線正接関数) | $f(x) = \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$ |
Softmax関数 | $f_i(x) = \frac{e^{x_i}}{\sum_j e^{x_j}}$ |
Swish関数 | $f(x) = x \cdot \text{sigmoid}(x)$ |
GELU (Gaussian Error Linear Unit) | $f(x) = x \cdot \Phi(x)$ ($\Phi(x)$ は正規分布の累積分布関数) |
4.1 ベクトルの理解と社会データ表現
-
ベクトル
個人や集団の社会属性を数値化したもの。$$
\vec{v} = \begin{bmatrix}
\text{賃金} \
\text{労働時間} \
\text{管理職割合}
\end{bmatrix}
$$ -
集団比較
$\vec{\text{女性}}$ と $\vec{\text{男性}}$ のデータベクトルを比較。
4.2 行列による集団比較・変換
-
行列
複数人のデータを行列として整理。$$
A = \begin{bmatrix}
v_{11} & v_{12} & \dots \
v_{21} & v_{22} & \dots \
\vdots & \vdots & \ddots
\end{bmatrix}
$$ -
政策・制度の影響を行列変換で表現
$$
y = A\vec{x}
$$
4.3 内積・類似度評価
-
内積
二つの社会状態の一致度。$$
\vec{u} \cdot \vec{v} = \sum u_i v_i
$$ -
コサイン類似度
パターンの方向性比較。$$
\cos \theta = \frac{\vec{u} \cdot \vec{v}}{|\vec{u}||\vec{v}|}
$$
4.4 行列分解と格差要因の抽出
-
特異値分解 (SVD)
$$
A = U \Sigma V^T
$$潜在格差要因の分析。
-
主成分分析 (PCA)
主要要因の次元削減と可視化。
4.5 線形方程式系による公平条件モデリング
-
連立方程式
$$
A\vec{x} = \vec{b}
$$
手法名 | 数理的特徴 | 社会応用例 |
---|---|---|
クラメルの公式 | 行列式が0でない正則系の厳密解 | 完全に独立した条件から唯一の政策解を導出 |
ガウス消去法 | 逐次消去による解法 | 複数条件間の依存関係を調整しながら解決 |
LU分解 | 行列を下三角・上三角に分解し、繰り返し計算を効率化 | 複雑条件を分解し、政策シミュレーションに活用 |
逆行列法 | $\vec{x} = A^{-1}\vec{b}$(正則な場合) | 明確な政策ターゲット設定と実行 |
最小二乗法 | 完全一致しない場合、誤差最小化による近似解 | 不完全データや矛盾を許容しつつ、最もバランスの取れた解を算出 |
4.6 逆行列とは
逆行列は、線形方程式
$$
A \vec{x} = \vec{b}
$$
において、$ \vec{x} $ を直接求めるための最も強力な道具の一つです。
行列 $A$ に対して、以下の条件を満たす行列 $A^{-1}$ を 逆行列 と呼びます。
数学的定義
$$
A A^{-1} = A^{-1} A = I
$$
ここで $I$ は単位行列(対角成分が1、その他が0の行列)です。
逆行列を用いた連立方程式の解法
連立方程式 $A \vec{x} = \vec{b}$ は、逆行列 $A^{-1}$ を使って次のように一発で解けます。
$$
\vec{x} = A^{-1} \vec{b}
$$
これは「逆数をかけて $x$ を求める」という小学校で習う解法と同じ感覚です。
(例:$2x = 4$ のとき $x = 2^{-1} \times 4 = 2$)
逆行列が存在する条件
逆行列はすべての行列に存在するわけではありません。
次の条件を満たす 正則行列 だけに存在します。
- 正方行列(縦と横のサイズが同じ)
- 行列式 $\det(A) \neq 0$
行列式が0の場合、逆行列は存在せず、$A \vec{x} = \vec{b}$ は「解が無数にある」または「解が存在しない」ことになります。
AI応用イメージ
-
AIモデルの重み更新(解析解)
リッジ回帰や最小二乗法で用いる解析解:$$
\vec{w} = (X^T X)^{-1} X^T \vec{y}
$$ただし、大規模データでは逆行列計算は非効率・不安定なため、
実際は勾配法や数値的近似が使われることが多い。
4.7 線形独立性と多様性評価
-
線形独立
異なる属性・立場の独自性検証。$$
c_1\vec{v_1} + c_2\vec{v_2} + \dots + c_n\vec{v_n} = \vec{0}
$$ならないことが独立性。
4.8 固有値問題と次元圧縮:本質的な社会構造の発見
固有値問題は、社会システムに内在する 「支配的な構造」 や 「変化の方向性」 を発見するための重要な数学的手法です。
数学的定式化
固有値問題
$$
A \vec{v} = \lambda \vec{v}
$$
- $A$ :社会関係や影響構造を表す行列
- $\vec{v}$ :社会の支配的な状態・パターン(固有ベクトル)
- $\lambda$ :その影響の大きさ(固有値)
応用イメージ(フェミニスト政策分析)
手法 | 数理的特徴 | フェミニズム政策への応用例 |
---|---|---|
固有値解析 | 社会システムにおける影響力・不安定要因の抽出 | 格差を拡大・維持する「見えにくい支配構造」を数理的に特定 |
主成分分析(PCA) | 次元圧縮による本質的要因の抽出 | 多様な社会課題の中から「本当に影響力の大きい要因」だけを特定 |
ランク縮小・低ランク近似 | 複雑な社会データを単純化し、解釈しやすくする | データ過多・情報過多を整理し、政策決定をシンプルにする |
主成分分析(PCA)の定式化例
データ行列 $X$ から主成分を抽出し、次元を削減する手法:
$$
X \approx Z W^T
$$
- $Z$ :低次元化された政策特徴ベクトル
- $W$ :元の特徴空間への変換行列
4.9 フェミニストのための最小二乗法入門
~社会不平等を数理で可視化し、構造的格差に挑む~
1. 格差可視化のための数理モデル
ある変数(例えば勤続年数や学歴)に対して、男女それぞれの平均賃金がどのように変化しているかをモデル化するとき、最小二乗法を使って次のような回帰直線を導きます。
$$
\text{賃金} = a \times \text{勤続年数} + b
$$
ここで、$a$ は「1年勤続するごとの昇給額」、$b$ は「初任給」を意味します。
このモデルを男女別に求め、**格差の傾向(aの違い)や水準差(bの違い)**を比較できます。
2. 誤差(残差)とその意味
最小二乗法は、**「予測」と「実際の観測値」のズレ(残差)**を最小化する手法です。
$$
S(a, b) = \sum_{i=1}^{n} \left( y_i - (a x_i + b) \right)^2
$$
この「ズレ」を最小化することで、現実に最も近い公平・中立な数理モデルを作成できます。
3. 社会構造への応用例
-
賃金格差モデル
男女別の回帰式を求め、構造的賃金格差を可視化。 -
ガラスの天井分析
登用率データを用い、役職到達率の勾配差を解析。 -
メディア出演傾向分析
男女出演時間データを時系列解析し、露出格差の累積を測定。
4. 行列計算による拡張(多変量格差分析)
複数の要因(例:学歴、地域、業種)を同時に扱う多変量回帰にも最小二乗法は応用できます。
$$
\vec{y} = X \vec{\beta} + \vec{\varepsilon}
$$
- $X$:複数要因を含むデータ
- $\vec{\beta}$:各要因ごとの影響度(格差寄与度)
これにより、**「本当に性別だけが問題なのか?」**という誤魔化しに対抗し、要因ごとの影響度を数理的に分離・特定できます。
5.1 男尊女卑言説の音声波形をデジタル化して分析する基礎ステップ
数理的・工学的背景
日常に溢れる 男尊女卑的メッセージ を科学的に検証するためには、
「音声データ」を数値化し、定量的に分析することが第一歩となります。
処理ステップの概要
ステップ | 工学的処理 | 内容説明 |
---|---|---|
1 | 音声信号の取得 | マイクや録音デバイスから音声波形を取得 |
2 | アナログ信号 | 時間に対して連続的に変化する波形として取得 |
3 | AD変換(サンプリング & 量子化) | アナログ信号を一定間隔で数値化し、0と1のビット列に変換 |
4 | デジタル信号処理 | フィルタリング、特徴抽出、パターン認識など |
数式モデル
連続音声信号(アナログ信号)
$$
x(t) \quad (t \text{ is continuous time})
$$
サンプリングによる離散化
$$
x[n] = x(nT) \quad (n \in \mathbb{Z}, , T \text{ is sampling interval})
$$
量子化(0/1 ビット列化)
$$
x_q[n] \in {0, 1, ..., 2^k - 1}
$$
※ ここで、$k$ はビット深度(例えば8ビットなら $2^8 = 256$ 段階)
工学的意義
- 感情・抑揚・特定ワードをデジタル解析し、客観的な「言語暴力指標」作成に活用。
- 特定のフレーズや音のパターンを自動検出し、記録・証拠化を支援。
5.2 AD変換(アナログ-デジタル変換)の種類と特徴
❶ 逐次比較型(SAR: Successive Approximation Register)
-
特徴:
- 高速・低消費電力
- スマートフォン、音声デバイスに広く採用
-
仕組み:
- ビット単位で高精度化を繰り返しながら近似する方式
- 例:8ビットなら1ビットずつ確定させていく
❷ フラッシュ型(Flash ADC)
-
特徴:
- 超高速
- 構造が大規模で高コスト
-
仕組み:
- 2^n 個の比較器を並列動作させ一括変換
- 例:8ビットなら256個の比較器が必要
❸ パイプライン型
-
特徴:
- 高速と高精度の両立
- 映像・通信機器で広く使用
-
仕組み:
- 複数段のサブAD変換器を直列化して処理
❹ デルタ・シグマ型(ΔΣ: Delta-Sigma ADC)
-
特徴:
- 高精度・低周波向け
- 音響・医療・計測機器で使用
-
仕組み:
- ノイズシェーピング技術で高精度化
- 低速だが高分解能
方式 | 速度 | 精度 | コスト | 代表用途 |
---|---|---|---|---|
逐次比較型 | 高 | 中 | 低 | 音声、スマホ |
フラッシュ型 | 超高 | 低 | 高 | 高速映像、通信 |
パイプライン型 | 高 | 高 | 中 | 映像処理 |
ΔΣ型 | 低 | 超高 | 低 | 音響、医療、計測 |
5.3 FFTとは?
FFT(Fast Fourier Transform) は、連続または離散的に取得した時系列データ(時間領域)を 「周波数成分」 に分解する数学的アルゴリズムです。
これにより、データに潜む不均衡な繰り返し構造や、無自覚なバイアスのリズムを表面化させ、見えにくい構造的問題を科学的に検出・分析できます。
数学的背景
FFT は、次の 離散フーリエ変換(DFT) の高速計算アルゴリズムです:
$$
X(k) = \sum_{n=0}^{N-1} x(n) \cdot e^{-j 2\pi \frac{kn}{N}}
$$
- $x(n)$:時間領域信号(n番目のデータ)
- $N$:データ点数(サンプル数)
- $X(k)$:周波数領域の成分(k番目の周波数)
- $e^{-j 2\pi \frac{kn}{N}}$:複素指数関数(回転因子)
FFTの適用条件(重要ポイント)
FFTを正しく適用・解釈するには、いくつかの前提・条件があります。
条件 | 説明 |
---|---|
1. サンプル数が2のべき乗 | FFTは一般にデータ長 $N$ が 2, 4, 8, 16, ... の 2のべき乗 であると最も効率的に計算できます。 |
2. 時間間隔が等間隔 | 入力データ(サンプル)は等間隔で取得されている必要があります(サンプリング間隔一定)。 |
3. 有限長データ(ウィンドウ処理) | 無限長信号は扱えないため、一定区間に切り出して解析する必要があります。ウィンドウ関数(ハニング、ハミングなど)を用いて端の効果を抑えることが推奨されます。 |
4. 実数 or 複素数対応 | 実世界データは通常実数ですが、複素数信号(IQ信号など)にも適用可能です。 |
5. サンプリング定理遵守(ナイキスト周波数) | サンプリング周波数 $f_s$ の半分(ナイキスト周波数)までしか正しく解析できません。十分なサンプリング周波数が必要です。 |
6.1 統計学手法のまとめ:偏りと格差の科学的分析のために
1. 記述統計(Descriptive Statistics)
-
平均・中央値・最頻値
賃金・登用率・在職年数などの代表値を把握する。 -
分散・標準偏差
性別・属性ごとのばらつき、格差の大きさを数値で評価。 -
パーセンタイル・四分位数
上位10%に女性がどれだけ含まれているかなどを分析。
2. 確率と確率分布
-
ベルヌーイ分布・二項分布・ポアソン分布
採用・昇進などの成否を確率的にモデル化。 -
正規分布
試験成績、昇進評価、賃金分布などを統計的にモデル化。
3. 推測統計(Inferential Statistics)
-
信頼区間
賃金格差の「ありえる範囲」を推定。 -
仮説検定(t検定・カイ2乗検定・F検定など)
「性別による昇進差は偶然か?」を検証する。
4. 回帰分析
-
単回帰分析
「労働時間と賃金の関係」など1対1の関係性を明示。 -
ロジスティック回帰
採用される/されないなどの2値判定を予測。 -
重回帰分析
「性別+学歴+業種」など、複数要因が賃金に与える影響を統計的に評価。
5. 多変量解析(Multivariate Analysis)
-
主成分分析(PCA)
多次元データから「格差の構造」を抽出。 -
因子分析
背後にある「見えない要因」をモデル化(例:職場文化や無意識バイアス)。
6. クラスタリングと分類
-
K平均法
行動や特性でデータを自動分類(例:職種グループ分け)。 -
決定木・ランダムフォレスト
性別・年齢・経験のどれが意思決定に影響しているかを可視化。
6.1 機械学習とは何か
機械学習 (Machine Learning) とは、データからパターンや規則を学習し、未来のデータに対して予測や分類を行う技術です。
明示的なルールをすべてプログラミングするのではなく、**「データから自動で学ぶ」**のが特徴です。
-
活用例:
- 採用選考の自動評価
- 賃金格差分析
- SNS上の差別発言の自動検出
しかし、学習に使われるデータ自体に偏りがあれば、AIはその偏見を再生産してしまいます。
だからこそ、フェミニストには**「AIは中立ではない」ことを理解し、
データやアルゴリズムに批判的視点**を持つことが求められます。
6.2 教師あり学習(Supervised Learning)
教師あり学習は、「正解ラベル」が与えられたデータから学習する方法です。
例
データ | ラベル |
---|---|
年齢:25, 経験年数:2 | 昇進しない |
年齢:35, 経験年数:10 | 昇進する |
AIはこのような**「特徴」と「結果」**の関係を学びます。
-
主な手法
- ロジスティック回帰
- サポートベクターマシン (SVM)
- 決定木・ランダムフォレスト
- ニューラルネットワーク
-
注意点
- 学習データに格差・バイアスがあれば、そのまま再生産されるリスクがある。
6.3 教師なし学習(Unsupervised Learning)
教師なし学習は、「正解ラベル」がないデータから、隠れたパターンや構造を発見する方法です。
例
-
類似する人をグループに分ける(クラスタリング)
-
性別や属性によらない多様なパターンを探す
-
主な手法
- K-meansクラスタリング
- 階層クラスタリング
- 主成分分析 (PCA)
-
注意点
- 何を「似ている」と判断するかの基準次第で、望ましくない集団分けをしてしまうリスクがある。
6.4 ニューラルネットワークと深層学習(Deep Learning)
ニューラルネットワークは、人間の脳の神経回路を模した計算モデルです。
複数の「層」を重ねて、複雑なパターンを学習できます。
-
基本構造
- 入力層:年齢、経験年数、性別などの特徴量
- 隠れ層:非線形変換・特徴抽出
- 出力層:昇進する/しない などの予測結果
数式例
$$
\text{Output} = \sigma(Wx + b)
$$
($\sigma$:活性化関数、$W$:重み、$b$:バイアス、$x$:入力)
-
主な活用分野
- 画像認識(顔認識AIなど)
- 言語処理(チャットボット、差別発言フィルター)
- 時系列予測(賃金格差の将来予測)
-
リスク
- 「なぜその判断をしたのか」が見えにくく、説明責任が問われる「ブラックボックス問題」
- 学習データの偏りを無批判に強化してしまうリスク