【統計学】 正規分布の分かりやすい説明 の続きで、今回は標準正規分布を用いた確率の計算方法を解説していきます。
以前【統計学】 確率密度関数の簡単な説明で紹介したように、事象の確率は確率密度関数を積分することで計算できます。
まず正規分布の確率密度関数は
で定義されています。
ここのeとは※ネイピア数を表していて、e=2.7128…とされています。πはもちろん円周率で3.14です。そしてμ が正規分布の平均であり、σの2乗 が分散となります。
※ネイピア数については↓を参照⇨【統計学】 常用対数とは?
もし確率変数X が、平均μ、分散σの2乗 の正規分布で表されるとき、X ~N(μ,σ 2) と一般的に表記され、正規分布の分布関数はF(x)と下の式で表されます。
というわけで、「平均と分散が特定できれば、正規分布の形は定まり確率計算が可能」となります。
そして確率変数 X が正規分布である場合、F(x) = P(X <x) の値を正規分布に従って求めます。そのための方法の1つが、正規分布を標準正規分布に変換して標準正規分布表を用いることです。
普通に考えて、正規分布の平均と分散の組み合わせは数え切れないほどあるので、全ての場合について計算した表はないですし、いちいち正規分布の確率密度関数の計算するのは、面倒なので、通常は「正規分布を標準正規分布になるように標準化し、標準正規分布表に当てはめる」というのが一般的です。標準正規分布で表せる数値は計算され、既に数値表になっており、t検定などで使用されています。
そして、「標準正規分布」とは、「平均0標準偏差1の正規分布」です。これは正規分布をより計算しやすいように工夫したものです。
標準正規分布は、N(0,1)と表され、上の正規分布の確率密度変数の式に、μ=0、σの2乗=1を代入することで、下のように表されます。
そして、確率変数Xは下のような式で標準化されます。
そして標準正規分布は下のような分布となります。
参照(http://bio-info.biz/statistics/distribution_normal_distribution.html)
色のついた部分の面積の合計は1で、 μ=0,σ=1です。下の%は何を表しているのかというと、μ±1σ 以下の範囲に確率変数 X が含まれる確率は 、68.27%、μ±2σ 以下では 95.45%、μ±3σ 以下では 99.73% ということを表しています。
ちなみにσはシグマといい、標準統計量の1つです。シグマ区間の考え方は株式投資においてもテクニカル分析で使われています。
ちなみに模試で使われる偏差値は平均を50、標準偏差を10としたもので、もし偏差値が60の場合は上から約16%、70の場合は上から約2.3%、80の場合は約0.14%のところに位置しているということが言えます。
MARCHや早稲田もよくネットの某掲示板で、馬鹿にされていますが、普通に考えると上位3~15%に位置していて、学歴ヒエラルキー的にはにはかなり上の部分に属しているいるわけです。
関連記事
コメント