1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

破砕粉や河原の石のサイズはなぜ対数正規分布になるのか?

1
Last updated at Posted at 2025-10-24

導入

粉体の粒径分布や河原の石の大きさを測ると、横軸を対数にした途端にきれいな釣鐘が現れることがあります。これは偶然ではありません。破砕や摩耗は「サイズが何倍かに変わる」乗法過程で進むため、対数を取ると乗法は足し算に変わり、中心極限定理(Central Limit Theorem; CLT)が働いて ln(粒径) が正規分布へ近づくからです。
本記事では、この原理を最小の数式とGoogle Colabで回せる短いコード、そして9枚の図で直感的に確認します。初期分布が対数正規でなくても、反復により対数軸で釣鐘が立ち上がることを実演します。

TL;DR

  • 破砕・摩耗の反復は「何割になる」という乗法の世界。
  • 粒径 $𝑑$の対数$ \mathrm{ln}\ d $は加法の中心極限定理で正規分布へ近づき、元の$𝑑$は対数正規分布に近づきます。
  • 初期が一点集中でも一様でも二峰性でも、反復を重ねると対数軸で釣鐘が立ちます。
  • 検定は大標本で過敏になりがちなので、$KS$統計量(効果量)と$Q–Q$プロット(直線性)を主に見ましょう。併せて$d50 / GSD$を報告すると実務的です。

実験設計(データとモデル)

初期分布を ①一点集中(delta)②一様(uniform)③二峰性(bimodal)から始め、
$$
d_{t+1} = d_t R_t, \quad \operatorname{ln} R_t \sim \mathcal{N}(\mu, \sigma^2), \quad \mu < 0
$$を10回反復して ln(粒径) の正規化を観察します。図は対数軸ヒストで収束の流れを示し、最終ステップには対数正規の理論曲線を重ねます。さらに $Q–Q$ プロット, $KS$統計量と $p$ 値, $d50/GSD$ を出力します。

ノートブック:Open In Colab

再現手順:

GitHub にコードと図フォルダを置き、上のバッジから Colab で開いて実行します(Colab 標準の numpy / matplotlib / scipy のみ、追加インストール不要)。

最小の数式(1段落)

サイズ $d_{t}$がイベントごとに倍率$R_{t}$をかけて変わると、
$$
d_{t+1} = d_t R_t \quad \Rightarrow \quad \operatorname{ln} d_{t+1} = \operatorname{ln} d_t + \operatorname{ln} R_t
$$$ \mathrm{ln}\ R_{t} $を独立同分布とみなせば、加法の中心極限定理が働き、$ \mathrm{ln}\ d $は正規分布へ近づきます。結果として$d$は対数正規分布になります。線形軸で右に長い尾が見えるのは、乗法が“伸びる側”に尾を作るからで、対数軸で見ると釣鐘が現れます。

公開コードの概説

このスクリプトは、粒子サイズ$d$がイベントごとに何倍かへ変化する「乗法過程」を模倣します。具体的には、対数を取った$ \mathrm{ln}\ d $に正規乱数を足し込む操作を10回繰り返し、掛け算の中心極限定理により $y$が正規分布へ近づく様子を目で確認できるようにしています。初期分布は、ほぼ一点集中(delta)、区間一様(uniform)、二峰性(bimodal)の三種類を用意し、最初は対数正規とは程遠い形でも、反復で対数軸に釣鐘が立っていく流れが見えるようにしました。表示は最初の4ステップを横並びの対数軸ヒストグラムで示し、最終ステップでは対数正規の理論曲線を重ね描き、さらに$Q–Q$ プロットで「ln(粒径) が正規にどれだけ近いか」を確認します。最後に、現場でよく使う $d50$(幾何平均)と$GSD$(幾何標準偏差)、そして$KS$ 検定の統計量と $p$ 値を出力します。ラベルの重なりを防ぐため、対数軸の主目盛をデータ範囲に応じて間引き、補助目盛の数字は非表示にしています。

結果

図1:delta の収束(Iter 0–3, log)

一点集中に近い初期から、反復とともに対数軸上のヒストグラムが左右対称に整い、釣鐘型に近づいていきます。線形軸では右裾が伸びますが、対数軸にすると正規形に見えることが視覚的に確認できます。
図1

図2:delta 最終の対数正規フィット(Iter 10)

対数正規の理論曲線がヒストグラムに良好に一致し、ln(粒径) が正規分布化したことが分かります。出力例:KS=0.004, p≈0.83, d50≈198 µm, GSD≈2.19。
図2

図3:delta 最終の Q–Q プロット

点列は対角線上にほぼ重なり、中央域の直線性が高いことを示します。端部のわずかなズレは有限標本の影響です。
図3

図4:uniform の収束(Iter 0–3, log)

一様分布から出発すると、初期は台形的ですが、反復で釣鐘へ滑らかに移行します。端の「平らさ」が徐々に消える様子も読み取れます。
図4

図5:uniform 最終の対数正規フィット(Iter 10)

理論曲線との整合は良好で、初期が対数正規でなくても反復により対数正規に寄っていく過程が見て取れます。例:KS≈0.017, d50≈47 µm, GSD≈2.67。
図5

図6:uniform 最終の Q–Q プロット

中央域は対角線に良く重なります。サンプルが大きいと p 値は小さく出やすいため、KS統計量の小ささとQ–Q の直線性を主に評価してください。
図6

図7:bimodal の収束(Iter 0–3, log)

混合母集団でも、反復が進むと二つの峰が近づき、単峰の対数正規へ向かう「方向性」を示します。工程によっては二峰が残りますが、純粋な乗法反復だけを見ると収束傾向が観察できます。
図7

図8:bimodal 最終の対数正規フィット(Iter 10)

全域で完全一致とまではいかないものの、主峰は良好に一致します。乗法過程が ln(粒径) の正規化を促すことを定性的に裏づけます。例:KS≈0.021, d50≈88 µm, GSD≈3.31。
図8

図9:bimodal 最終の Q–Q プロット

中央域の直線性が確認でき、両端の小さな曲がりが混合の名残を示します。大標本では p 値が小さく出やすいことに留意し、効果量(KS統計量)と Q–Q で総合判断してください。
図9

用語メモ

  • 中心極限定理(CLT):独立同分布の乱数の和は、回数が多いと正規分布に近づくという基本定理。本記事では「対数を取ると乗法が和になる」性質を使います。

  • 対数正規分布:$ \mathrm{ln}\ d $が正規分布に従うときの $d$の分布。線形軸では右に長い尾を持ち、対数軸では釣鐘に見えます。

  • Kolmogorov–Smirnov(KS)検定:理論分布(ここでは正規)と経験分布の差の最大値を測るノンパラメトリック検定。KS統計量が小さいほど理論に近い。$p$ 値は「理論から外れているとは言えない」確率ですが、標本が大きいと非常に小さくなりやすいため、$Q–Q$プロットと併読します。

  • $Q–Q$プロット:理論分布の分位点とデータの分位点を並べた図。直線に乗るほど理論分布に近いことを意味します。

  • $d50$(幾何平均=メジアン):対数正規分布における中央値。ここでは$d_{50} \approx \exp(\mu)$。

  • $GSD$(幾何標準偏差):対数正規分布のばらつき指標。ここでは $\mathrm{GSD} \approx \exp(\sigma)$。大きいほど分布が広いことを示します。

まとめ

破砕粉や河原の石が対数正規分布に見えるのは、現象の背後にある掛け算の中心極限定理の表れです。初期が一点集中でも一様でも二峰性でも、反復を重ねれば対数軸で釣鐘が立ち上がり、最終的には対数正規が良い要約になります。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?