このページはJavaScriptを利用しています。 JavaScript対応ブラウザで、JavaScriptをOKとしてご覧ください。 数理ファイナンス[MathematicalFinance]

正規分布

△△トップページへ戻る△△

関数形式

正規分布は、確率変数xが次の確率要素にしたがう分布を持つことをいう。

正規確率素分

従って、分布関数は、

正規分布関数

となる。いまさらだが平均ゼロ、分散1となる標準正規分布関数の核となる密度関数のグラフを載せておこう。グラフはよく知られたベル型(カーブ)となる。思い描いているものより尖ったものと感じられることが多いようであるが、標準偏差が[-3.0,3.0]の範囲でかなりの確率(おおよそ997/1000)がカバーされることが分かる。このことはデータ分析の中で利用される有用な事実である。

正規分布グラフ

もちろん分散の値を変えれば形状はいくらでも変わる。分散→0と極限をとれば、密度関数fは、f=0(x≠0)かつf=∞(x=0)となりながら全領域の積分が1というディラックのデルタ関数となり、さまざまな場面で利用されている。平均ゼロのままで標準偏差を1.0→0.5→0.3→0.1 と変化させたグラフでそのイメージをみておこう。次第に背が高く尖ってくる。いずれも全領域の積分が1となることは変わらない。

正規分布グラフ

この描画のスクリプトは確率分布描画Scilabスクリプトにあるので、値を変更されるなどしてためされるとよい。

ついで正規分布に関連する母関数を示す。i=√(-1)である。

特性関数:E(exp(itx))=exp(iμt-σ2t2/2)
積率母関数:E(exp(tx))=exp(μt+σ2t2/2)

母関数を使えば、正規分布は2次までの積率で多様な表現が可能であることが証明できる。そしてそのパラメータは平均μと分散σ2である。N(μ,σ2)と表記することが多い。
母関数を利用して直ちに得られる計算例を挙げておこう。
Wtが正規分布N(0,t)に従うとするならば、
 E(exp(σWt))=exp(σ2t/2)
これは連続型モデルでのリスク中立確率を求める際に利用する。もちろん直接計算でも求められる。

上式の積分は初等的な関数で記述することができないため、数値を求めるためにはいちいち積分計算が必要となる。この面倒を避けるために一般に利用されるのは、z=(x-μ)/σという変数変換によって、dx=σdz として、

標準正規分布関数

という形式にする。この分布は、平均0、分散1にしたがい、N(0,1)と書く。標準正規分布といい、数表が用意されている。

期待値と分散

正規分布は期待値、分散が所与で与えられているという説明が多いようだが、計算によって求めることもできる。別項で求めた次の積分の補題を応用する。

正規分布原型

では期待値を求めてみよう。

正規分布期待値

大括弧はゼロとなる。途中の√(2π)が積分の補題の応用である。変数変換を利用して確認されるとよい。これで期待値が求められた。この証明法とは異なる確率密度が偶関数であることを利用した証明は別項で与えておいた。

つづいて分散を求めよう。上の期待値μを使って、同様の変数変換する。

正規分布分散

等号の2行目は、V(x)=E(x2)-{E(x)}2を利用している。等号の三行目は、第2項の積分がゼロとなり、第3項の積分が1となるのは上で求めているものである。そしてうまく積に割って部分積分を使っていく。5行目の第1項がゼロとなるのは近似の上限で、z/(1+z2/2)を考えればよい。第2項は積分が√(2π)となるのは上でも利用した。

起源

正規分布は、その性質のよさや見た目以上の扱い勝ってのよさで、さまざまな活用が行われるが、広範に利用される理由は中心極限定理に支えれらている。中心極限定理はド・モアブルあるいはラプラスの証明を嚆矢とし、二項分布の階乗計算を近似することを目的としていた。現在では様々な条件の緩和や表現の工夫がなされているが、なるべく平易に主旨をわかりやすく述べると次のようになる。

中心極限定理
n個の確率変数が独立でかつ同一の分布に従っているとする。このn個の確率変数の和は、nが十分大きいとき、正規分布に従う。

特別な分布を仮定せずとも、独立で同一であるなら、その数を増やすと正規分布で近似できるというのは、人間社会や自然界ではすでによく観察されていることであるが、数学的にも証明が可能なのであった。

二項分布が正規分布に収束することを利用した活用事例を挙げてみよう。
Xが確率(1/2)で、0あるいは1の値をとる確率変数とする。n回の試行でXの合計xの値がkとなる確率は、
 P(x=k)=nCk(1/2)k(1/2)n-k
となる。nCkはn個からk個を取り出す場合の数である。さてこのxを利用した
 Y=(2x-n)/√(n)
はnが大きくなるとどういう分布に収束するだろうか。
まず、xの平均と分散を求めよう。二項分布の平均と分散はそれぞれnp、np(1-p)であるから、
E(x)=np=n/2
V(x)=np(1-p)=n/4
したがって、これを代入すると、
E(Y)=0
V(Y)=4V(x)/n=1
すなわち、Yは平均0、分散1となり、中心極限定理を援用すれば、十分nが大きくなると、N(0,1)の正規分布に収束することになる。これは二項モデルから連続モデルへの展開で利用するが、ひろく用途のある変換である。

中心局限定理の適応は正規乱数の発生においても利用される。

異なる導き方

正規分布は次のように考えることもできる。
いま何かの観測値の誤差がn個の値をとったとしよう。x1,x2,・・・,xn である。この誤差はおのおの独立な確率変数で、確率は確率素分dP=f(x)dxとすれば、
P=dP(x1)dP(x2)・・・dP(xn)
 =f(x1)f(x2)・・・f(xn)dx1dx2・・・dxn
となるが、この値はnが大きくなれば偶然が減ってくるので、確率最大で発生していると考えられる。すると最大条件として微分したものがゼロとなることが想定される。
そのままでは面倒なので、両辺の対数を取って微分してゼロとおく。微小の幅dxは定数として捨ててしまう。すると、
f’(x1)/f(x1)+f’(x2)/f(x2)+・・・+f’(xn)/f(xn)=0
となっているはずである。ここで、誤差の総和はゼロであるとしよう。Σx=0であるので、
-x1=x2+x3+・・・+xn となるから、dx1/dxn=-1、dx2/dxn=-1、・・・である。
そして、k(x)=f’(x)/f(x)と置きなおすと、マイナス符号を織り込んで
k’(x1)=k’(xn)、k’(x2)=k'(xn)、・・・、できるが、この条件を満足するためにはk’(x)は定数となる。
そこで、f’(x)/f(x)=ax+d となるが、
この切片dは真の値に含まれ観測操作でゼロとなっているだろうから、
f’(x)/f(x)=ax
この微分方程式を解けば、
f(x)=Cexp(ax2/2)
fはもともと誤差の密度関数であるので、a<0と仮定する。
a/2=-s2
とおき、上でも利用したよく知られた積分公式の補題、
∫exp(-z2)dz=√(π) (積分領域は全域)
を利用して、
密度関数は全領域[-∞,∞]を積分すると1となる条件から、
C∫exp(-s2x2)dx=(C/s)∫exp(-z2)dz=(C/s)√(π)=1より、
C=s/√(π)
となる。ここで、
s2=1/(2σ2)とすれば、
f(x)=(1/√(2)σ)(1/√(π))exp(-x2/(2σ2))
 =(1/√(2π)σ)exp(-x2/(2σ2))
という平均0、分散σ2の正規分布の密度関数が得られる。
このように多少強引だが、観測誤差の性質から正規分布を導くこともできるのである。

□2変数の正規分布へ進む>>

□多変量正規分布へ進む>>

□正規分布と最小二乗法へ進む>>

□正規分布の特性関数へ進む>>

Copyright (C)2006-07 M.Yonekura. All rights reserved.