あらゆる極座標系(Polar Coordinate System)上において、ほとんど必然性を帯びて極限(Limit)として置かれる無限遠点(Inf(inity))は、状況に応じて点や半径無限の円弧や球表面として表されます。
#統計言語Rでの汎用計算機代数ソフトウェアYacasによる計算例
library(Ryacas)
yacas("Limit(x,Infinity) (x^2+x+1)/(2*x^2+1)")
expression(1/2)
yacas("Limit(x,0) Sin(x)/x")
expression(1)
yacas("Limit(x,0) (1-Cos(x))/x^2")
expression(1/2)
そして、かかる座標系においては無限長(Unlimited Length)/無限次元(Unlimited Dimensions)への発散(Divergence)は無限長(Unlimited Length)/無限次元(Unlimited Dimensions)への収束(Convergence)と見做される様なのです。
光円錐(Light cone)- Wikipedia
リーマン球面(Riemann sphere)- Wikipedia
いずれにせよ我々の数理(Mathematical Things)は、かかる形而上学的概念(Metaphysical Concept)を19世紀前半のガウス積分(Gaussian integral)の証明(Demonstration)以降自明の場合(Trivial Case)とする展開を迎えました。すなわち(どの次元軸への発散も極限値としては等価となる)無限遠点(Infinity)において円関数(Circle Function)y=sqrt(半径r-x^2)、放物線関数(Parabolic Function)y=±x^2およびその逆関数y=±sqrt(x)、双曲線関数(Hyperbolic Function)y=sqrt(x^2-半径r)およびその逆関数y=1/sqrt(x^2-半径r)といった円錐曲線(Cone Section)は全て交わる(一点/単一円弧上/単一球表面上に収束する)と考える様になったのです。
ガウス分布の導出 - Qiita
二次曲線(円錐曲線)の分類(四通りの方法)
指数関数(Exponential Function)y=exp(x)とその逆関数たる対数関数(Logarithmic Function)y=log(x)、ステップ関数(step functio)の積分結果たるシグモイド関数(sigmoid function)などもまた無限遠点において交わりますが、これらは観測原点0が長さ1の単位直線(Unit Line)における1、半径1の単位円(Unit Circle)/単位球(Unit Sphere)と紐付けられた超越関数(Transcendental Function)なのでまた異なった振る舞いを見せます。
超越関数(Transcendental Function)- Wikipedia
【初心者向け】指数・対数関数の発見
【初心者向け】三角関数と指数・対数関数の「巡回性」について。
【初心者向け】ロジスティック方程式とその関連範囲
##初まりはカルタゴ建国神話(等周定理)。
そして微積分解析概念の大源流に接続。
こうした発想の大源流は伝説上「1本の紐を与えられ、それを用いて海岸線に沿った半円を描いて最大面積を得た」フェニキア人都市テュロスの植民市カルタゴの女王ディド(古希:Διδώ, Dīdō, 羅: Dido)に帰せられます(紀元前9世紀頃)。形而上学が「発明」された古代ギリシャ世界成立期(紀元前8世紀)よりは遡るものの、ヒッタイト(紀元前16世紀~紀元前1180年)が滅び、エジプト新王国(紀元前1570年頃~紀元前1070年頃)衰退が始まった「紀元前1200年のカタストロフ」までは遡らない絶妙な時代設定。
ディードー - Wikipedia
まるで未来の設計図!紀元前の軍港が斬新すぎる
要するにここで言っているのは「等周定理(Isoperimetric Theorem)=周長が一定の図形において面積が最大となるのは円」なる概念(Concept)の事です。
等周問題に関連する高校数学の問題 | 高校数学の美しい物語
等周問題
おそらくこの時代までには既にピタゴラスの定理(Pythagorean Theorem)半径r=sqrt(x座標^2+y座標^2)は発見済みだったと考えられています。すなわち理論上は当時から既にモンテカルロ法(MC=Monte Carlo method)を用いて「半径1の円の面積はπ」が証明可能だったのです。
三平方の定理 (ピタゴラスの定理) の歴史 - 考古学的事実 - 新石器時代欧州
【初心者向け】ピタゴラスの定理あるいは三平方の定理からの出発 - Qiita
【初心者向け】「モンテカルロ法」概説 - Qiita
当然、以下も自明の場合(Trival Case)扱いだったと推測されます。
- 直径(Diameter)は半径(Radius)rの2倍すなわち2r(距離1(0→r)+距離1(-r→0))
-
半径rの円弧(Circle)の周長(Perimeter)は2πr
【初心者向け】挟み撃ち定理(Squeeze Theorem)による円周率πの近似
- 円の面積は半径r*(半径r*周長2π/2)の矩形計算に置き換え求める(扇算)
円の面積の求め方と覚えるコツ。なぜ半径×半径×3.14になるか|アタリマエ!
最後の「扇算」概念は数値積分(Numerical Integration)における矩形近似法(Rectangle Approximation Method)の三角形/台形近似法(Triangle/Trapezoidal Approximation Method)への拡張を経て以下の微積分概念、すなわち解析学(Analysis)の世界へと接続します。
【初心者向け】半径・直径・円周長・円の面積・球の表面積・球の体積の計算上の往復 - Qiita
台形公式を用いた積分の近似とその誤差
-
y=x^nを微分(Differential)すると(x^n)'="y=nx^(n-1)となる。
導関数の意味といろいろな例 - 逆にy=nx^(n-1)を不定積分(Indefinite integral)するとy=x^n+積分定数Cとなる。
【積分】積分記号の意味 | 大人が学び直す数学
上掲投稿でも触れてますが実は私、中高生時代に一度「解き方を覚えても覚えても次々と例外処理が現れる」不毛な戦いの連続に心が折れ、一旦微積分計算に挫折しているのです。再学習の契機となったったのは、こうした見かけ上の振る舞いの背後に「近似の精度向上と計算速度向上の為なら方法論的一貫性を平気で放棄する真摯な現実主義」が透けて見えるパラダイムシフトを経験して以降。あと「コンピューターに代わりに計算させて結果を見る」手抜きが可能となって全体像を俯瞰するのが容易になったせいでもありました。
#統計言語Rでの汎用計算機代数ソフトウェアYacasによる計算例
library(Ryacas)
#微分と積分の基礎
yacas("D(x) x^n")
expression(n * x^(n - 1))
yacas("D(x) x^3-3*x^2+4*x-2")
expression(3 * x^2 - 6 * x + 4)
yacas("Integrate(x) x^n")
expression(x^(n + 1)/(n + 1))
#定積分
yacas("Integrate(x,x1,x2) Cos(x)")
expression(sin(x2) - sin(x1))
yacas("Integrate(x,0,2) Abs(x-1)")
expression(1)
#色々な積分
yacas("Integrate(x) x^a")
expression(x^(a + 1)/(a + 1))
yacas("Integrate(x) 1/x")
expression(log(x))
yacas("Integrate(x) 1/Cos(x)^2")
expression(tan(x))
yacas("Integrate(x) a^x")
expression(a^x/log(a))
#偏微分(Partial Derivative)計算
D01<-expression(x^2*y+3*x*y^5+x^3)
#xによる偏微分
D(D01,"x")
2 * x * y + 3 * y^5 + 3 * x^2
#yによる偏微分
D(D01,"y")
x^2 + 3 * x * (5 * y^4)
#以下の様な連続計算も可能
yacas("f1(x) := 2*x+3")
expression(TRUE)
yacas("f2(x) := 2*x^2+3*x-1")
expression(TRUE)
yacas("D(x) f1(x)*f2(x)")
expression*23
yacas("Simplify(%)")
expression(12 * x^2 + 24 * x + 7)
#高次導関数
yacas("Simplify(D(x,2) Exp(x)*Sin(x))")
expression(2 * (exp(x) * cos(x)))
#Simplifyしないとこう。
yacas("D(x,2) Exp(x)*Sin(x)")
expression(exp(x) * cos(x) - exp(x) * sin(x) + (exp(x) * cos(x) +
exp(x) * sin(x)))
#その他いろいろ(その1)
yacas("Simplify(%)")
expression(12 * x^2 + 24 * x + 7)
yacas("D(x) 1/(2*x+1) ")
expression(-2/(2 * x + 1)^2)
yacas("D(x) (3*x-1)/(x^2+1)")
expression*24/(x^2 + 1)^2)
yacas("Simplify(%)")
expression*25
yacas("D(x) (2*x^3-1)^4")
expression(24 * (x^2 * (2 * x^3 - 1)^3))
yacas("Simplify(%)")
expression(24 * (8 * x^11 - 12 * x^8 + 6 * x^5 - x^2))
yacas("D(x) Tan(x)")
expression(1/cos(x)^2)
yacas("D(x) Ln(x)")
expression(1/x)
yacas("D(x) a^x")
expression(a^x * log(a))
yacas("Exp(x)")
expression(exp(x))
##無重力下を球状で漂う液体(最大エントロピー原理)のイメージを経て正規分布概念に接続。
こうした諸概念に「起こりうる全ての事象を足し合わせると1=100%となる」連続形確率変数分布(Continuous Random Variable Distribution)の概念を導入すると、上掲の等周定理に由来する「無重力下に放り出された液体が(流体力学の作用である表面張力が働く事から)理論上球状にまとまる」物理現象が「最大エントロピー原理=ある条件下でエントロピーを最大化するということは、条件以外の情報を全く含まない自然な分布である」と結びつき「(一辺2の正方形に収まった)半径1面積πの円状分布」が顕現する展開を迎えます。
無重力下で液体はどう動く? ~ロケット開発に生かされる流体力学~
これにさらに上掲の無限遠点の同化作用を援用し、一辺がsqrt(π)の方形との相互変換を介して有名なy=exp(-x^2)と対応付けたのが有名な正規分布(Normal Distribution)の出発点、すなわち「観測原点から無限遠点にかけて一次元(One dimension)上に釣鐘曲線(Bell Curve)を描く理論上最も自然状態に近い分布」となります。考えてみれば、そもそも計算の基底に放物線(parabola)が選ばれたのも「(斜め上に投げ上げた物体が、最高高度到達地点を中心に均等な軌跡を描く)地上に存在する最も自然な曲線の一つ」と目されていたからかもしれません。
【初心者向け】正規分布(Normal Distribution)とは何か?
よく見かけるさらに複雑な式は、面積計がπとなるこの計算を「起こりうる全ての事象を足し合わせると1=100%となる」連続形確率変数分布(Continuous Random Variable Distribution)に適用させた結果。
実際、横軸(確率変数)に与える算術平均(Arithmetic Mean)や縦軸(確率密度)に与える標準偏差(Standard Deviation)といったパラメーター(parameter)が設定可能となった事で、より多様な分布状況に柔軟に対応する事が可能となりました(パラメトリック検定)。
統計検定を理解せずに使っている人のために II
##そして「無限遠点としての正規分布」と「統計学の暗黒時代」について。
正規分布を最小二乗法(Least squares)の適用を考えている天文観測データから顕著な外れ値を除去する為の誤差関数(ELF=error function))として導入したガウス。
誤差関数 - Wikipedia
正規分布と誤差関数
正規分布という王様が誕生する
最小二乗法 - Wikipedia
最小二乗法(直線)の簡単な説明
しかしその一方でガウスは無造作に「観測サンプル数が無限大に近くにつれ、誤差も限りなく0に近づいていく」と信じていた様です。何しろ彼が取り組んでいたのは「究極的には厳密な正解がただ一つ存在するだけの天体観測データ」だった訳ですから、その事自体は別に不思議でも何でもありません。
正規分布の歴史をわかりやすく紹介!【ガウスとラプラスとドモアブル】
ガウスは1809年、「天体観測で発生する観測誤差をなんとかなくせないものだろうか・・・」と考え、その対策方法を論文にまとめました。
その過程で、経験則から誤差の振る舞いについて「誤差はマイナス誤差もプラス誤差も等しくおこる」「大きい誤差よりも小さい誤差の方が発生しやすい」「極端に大きい誤差は滅多に起こらない」という3つの仮定を考えます。
この3つの仮定を用いて誤差が起こる確率を求め、横軸を誤差の大きさ、縦軸がその誤差が発生する確率としてプロットすると正規分布になることを発見したのです。
19世紀後半には国際的に産業革命導入の影響が表面化してきます。都市計画の指針として統計学が急速に発達。これにより伝統的地域共同体の解体が急速にが進み、19世紀末には「社会の今」を調査と分析によって把握すべく社会学(Sociologie)なる学問ジャンルまで新設されたのです。
社会学 - Wikipedia
-
フランス社会学…アソシアシオン(Association=自治体)オリエンテッドな活動を重視するその姿勢の大源流はトクヴィル「アメリカの民主政治(De la démocratie en Amérique, 第1巻1835年、第2巻1840年)」において既に理想視が始まっていたインテリ階層の「米国開拓地住人の共助生活」への憧憬にまで遡る。黎明期には方法論的集団主義を掲げるデュルケームが「犯罪社会は相互模倣によって成立する」としたタルドの模倣犯在学を「社会の実在を信じない社会心理学的アプローチ」と弾劾した「社会実在論争」が有名。
フランスのアソシエーション -
ドイツ社会学…発足当初より心理社会学(方法論的個人主義)的側面が強く「社会環境が個人に与える有形・無形の影響や拘束」に注目。黎明期には「マルクス・フロイト主義」なる表現が散見されたが、これはカール=マルクスの「経済学批判(Kritik der Politischen Ökonomie、1859年)」における「我々が自由意思や個性と信じ込んでいるものは、実際には社会の同調圧力に型抜きされた既製品に過ぎない」なる宣言や、フロイドの精神分析が突き付けた「我々の思考や行動の多くは自我の意思というより無意識からの要請に由来している」なる発表の影響で、有名なマックス・ウェーバー「プロテスタンティズムの倫理と資本主義の精神(Die protestantische Ethik und der 'Geist' des Kapitalismus, 1904年~1905年」も「それなら(サイレント映画「カリガリ博士(Das Cabinet des Doktor Caligari, 1920年)」に刻印された様な「気付くと催眠術や無意識からの声の言いなりになっている」実存不安を超克し)実際に社会を変えてきた運動を支えてきた成員は、より具体的には如何なる人格や生活態度の人々だったのか?」に注目し、そのアプローチから資本主義勃興過程を解き明かそうとした点において、しっかり「時代の子」の一人であったといえよう。
心理社会学へ向けて
そう考えると、1918年にロナルド・フィッシャーが「分散(variance)」なる概念を導入したのも、こうして主要観察対象が「(究極の正解は原則として一つしか存在しない)個々の星の軌跡」から「(現実の観察対象自体が不揃いの、そのくせ統計的にしか把握し得ない)地上の諸現象」に移行した状況への当然の対応に過ぎなかった気がしてきます。
ロナルド・フィッシャー(1890年~1962年)-Wikipedia
分散(variance)-Wikipedia
- 例えば(フランスでは絶対王政時代の17世紀から既に統計学的アプローチの導入が始まっていたとされる)砲弾製造の品質管理システム一つ取っても「個々の不良品発生原因に対する個別対応」の地道な積み重ねがあるだけで不良品の発生そのものは理論上においてすら完全には防げないし、対応すべき対象や内容のプライオリティも状況に合わせ刻々と推移していく。当時のフランス軍部の面白さは、かかるミッション・クリティカル(Mission Critical)な状況に対処可能なのはベイズ統計のみであると考え、実際にその運用を続けた点にある。軍部が被告となった「ドレフェス事件(1894年~1906年)」において軍部が最終的に敗北を認めたのも、実際にはインテリ階層の社会的圧力に屈したからではなく(ベイズ統計的技法によって)最も重要だった証拠が偽造と証明された事が大きかったといわれている(ちなみに数学者ポアンカレの功績)。
グリボーバル・システム(système Gribeauval)-Wikipedia
エコール・ポリテクニーク(École polytechnique、通称X)-Wikipedia
ミッション・クリティカル(Mission Critical)-Wikipedia
ドレフェス事件(1894年~1906年)
ベイズ統計学(Bayesian statistics)-Wikipedia
TARO-NISHINOの日記:アンリ・ポアンカレ。科学の貢献での伝記
有名なドレフュス事件はポアンカレが象牙の塔から出る、もう一つの機会を与えた。1894年フランス情報部は、パリにいるドイツ大使館付き陸軍武官へ送られた、秘密情報の送付を告げるメモを見つけた。手書きの明らかな類似性は、ユダヤ人のフランス将校アルフレッド·ドレフュスの逮捕となった。1895年にドレフュスは軍法会議で有罪と断言され、ギアナのディアブル島へ追放された。フランスはすぐにドレフュスの支援者と敵対者に分かれた。長く懸命な闘いの後、新たな公判が1899年にレンヌで行われた。有名な警察専門家Bertillonは、メモの筆跡学的分析の中で似非科学的技法と確率論を使った。彼は自身の証言を以下のように結論づけた:
私のデモンストレーションを形成する観察記録と合意書のコレクションの中で、疑いの余地は無い。そして、これは理論的のみならず事件解決の鍵となる確信であり、そのような絶対的確信から成立する信頼性の感触を得て、率直に言って、1894年のように今日私は誓って、このメモは被告の仕業と断言する。
そんな申し立ては持論としてポアンカレには耐えられなかった。Painlevéの求めで書かれ、法廷で読まれた手紙の中で、Bertillonの結論における確率論の使用に対してポアンカレは強く反発した:
そこには科学的特徴は何も無い。被告に刑が宣告されるのか私は知らないが、もし彼なら、他の証拠に基づくべきである。しっかりした科学的教育を受けて来た、偏見のない人々にとって、そんな議論が何らかの印象を与えることは不可能だ。
だが、再び軍法会議はドレフュスを有罪だと断言し、今回は環境を緩和した。ドレフュスは大統領による恩赦を得たが、彼の支援者は再度1904年に控訴を得た。ポアンカレはアッペルとダルブーと一緒に長いレポートを書き、以下のように締めくくった:
それらのシステムすべてが絶対的に科学的価値を奪われている。すなわち、
- それらの疑問への確率論の応用は合理的でないため
- メモの再構築が偽りであるため
- 確率論のルールが正しく応用されていないため
一言で言えば、著者が偽りのドキュメントを基にして議論して来たためである。このレポートの結論は、法廷の判決を例証としている21の理由をページいっぱいに抜き出して、ドレフュスの無実を断言し、彼の名誉と権利を回復した。
その一方で「研究者のための統計学的方法(Statistical Methods for Research Workers, 1925年)」を著して推計統計学の中心的理論と研究方法の分野において最初のスタンダードを樹立したロナルド・フィッシャー。実験計画法(The Design of Experiments, 1935年), 分散分析(ANOVA=analysis of variance), 小標本統計理論といった革新的業績を次々と生み出しつつ、統計学全体の枠組みの中に、ピアソンのカイ二乗分布や、スチューデントのt分布を、正規分布や、彼自身の成果である分散分析やZ分布(正規分布に依存する所謂「偏差値」の計算根拠)とともに位置付けた先駆者だったがゆえに後世に(不幸にも当人が予想だにしていなかった展開により)数々の「負の遺産」も残す事になったのです。
偏差値と上位パーセントの対応表
分散分析(ANOVA=analysis of variance)-Wikipedia
フィッシャー情報量(Fisher information)-Wikipedia
- 統計学が扱う多様で多態的な分布の多くは、サンプル数が一定以上を超えると正規分布に吸収されてしまう(最初期人工知能アルゴリズムと重なるロジスティック回帰も、データがシグモイド曲線に沿って並んでいる様に見え始めたら、そこでGame End)。これにかこつけて「統計学が注目すべき分布は正規分布のみたるべきである」と主張する正規分布原理主義者が数多く現れ(聖地アッシュールに世界全てを帰属させようとした新アッシリア帝国や、太陽に捧げる生贄の心臓を調達する為に絶え間なく戦争を続けたアステカ人の狂信的熱意をもって)「異端者狩り」を繰り広げてきたのだった。ある種の全体主義であるばかりか、フィッシャーが生きていた時代には現代より好意的に評価されていた優生学の反映すら見受けられるが、その残滓は例えば日本の所謂「偏差値教育」などに深い爪痕を残し続けているのである。
偏差値にとらわれ過ぎ! 教育“後進国”日本の問題点を池上彰さん、増田ユリヤさんに聞いた - フィッシャー自身は、実は自ら考案した最尤推定(Maximum Likelihood Estimation)あるいは最尤法(Method of Maximum Likelihood)において採用した尤度(Likelihood)なる尺度について「与えられた有限データから推測可能な母集団の確率分布についての最良の予測」程度の事しか述べてない。ところが彼の後継者の中からは「母集団のデータの得られなかった部分すらも補完する魔法の計算方法」と言い出し、なおかつ機械学習の概念が普及した現代では、当時の彼らによる「さらなる母集団予測の精緻化を求める」アプローチはまとめて過学習(overtraining, 判断基準を既存データに依存し過ぎるせいで新規データへの対応不全が起こる現象)」に分類される展開を迎えた。
最尤法(Method of Maximum Likelihood)-Wikipedia
【統計学】尤度って何?をグラフィカルに説明してみる。
「過学習(過剰適合)」とは?原因や回避方法をわかりやすく解説! - よくいわれている様に「目が視える」人の置かれる状況は割と画一的だが「目が視えない」人が置かれる状況は障害の程度や範囲、周囲からどれだけサポートが得られているかに依存し多次元にわたる多変量的展開を見せる。それに対して正規分布原理主義者達は明らかに(各次元の分散度合いの指標に過ぎない)ベルカーブ1本に多くを負わせ過ぎ、個別対応能力を大幅に低落させて自ら「ベイズ統計学への敗北」に向けて墓穴を掘り続けてきたといえよう。またフィッシャーの生きた時代の統計学においては「母集団に比較してあまりに少ない標本しか得られない状況で、どれだけ正しい予測が可能か」こそが最大の主題だったが、コンピューターやインターネットが普及し、むしろ逆に「ビッグデータをどう料理するか」などが最大の主題となった現代の統計学は、そうした努力を全て過去のものにしてしまった現実も見逃せない。
多変量解析のための基礎知識
こうして全体像を俯瞰してみると(サンプル数の無限増大によってあらゆる分布の墓場と化す)正規分布にも、明らかに無限遠点的側面が存在する様です(それも恐らくネイピア数eや円周率πが直面する空間的限界とはまた異なるメタレベルの限界。実際「正規分布に収束」なる表現まで散見される)。そもそも正規分布は、その起源からして中央極限定理(CLT=Central Limit Theorem)の数理表現(放物線のY軸に向けての加速度的発散を、それを指数関数の引数とする事でX軸に向けての発散に変換)だった事を思えば、さもありなん。こういうアプローチでネイピア数eや円周率πとの関係の深さに思いを馳せるのも「観測原点と無限遠点の狭間に現れる数理体系の一環」を体感する貴重なエクスペリメント(Experiment=試行(Trial))とも?
中心極限定理(CLT=Central Limit Theorem)-Wikipedia
##将来の展望
今は関連数理を公理体系っぽく編纂するので手一杯ですが、そちらが一段落したら登場する関数を一通りプログラムで動かしてみたいです。きっと絶対に楽しく、まだまだ新たな発展がある筈…