« 『使いこなすとすごい標準偏差』 | メイン | 『最近の理系卒は・・・』 »
2007年09月03日
『すごいぞガウス!』
標準偏差 その3
『すごいぞガウス!』
標準偏差とは250年ぐらい昔にガウスという天文、数学、物理学者が考えたものらしい。
レオナルドダビンチやピタゴラスなどとならぶ超有名な万能科学者のようだ。
標準偏差は正規分布というものに従うことからきている。
正規分布とは左右対称の釣鐘型の分布のこと。
テストの点でたとえると範囲は0~100点
平均が50点だったとすると、1000人ぐらい受ければ
X軸に点数、Y軸にその点の人数というようにグラフを書くと50点をピークとする左右対称のグラフとなる。
このときのσが表す意味は
いろいろ理由はあるけど要約すると
50±σ=(50-σ)~(50+σ)
の範囲にデータがある確率は68.27%となる。
これをガウスさんが見つけたらしくて、正規分布のことをガウス分布と呼ばれることもある。
250年前にこんなものを見つけてしまうなんてさすが天才は違うねー。
ちなみに標準偏差は次のようにして求められます。

ということでもしσが10なら
50±10=40~60点の間に68.27%の人が含まれていることになります。
σ=1なら 50±1=49~51点の間に68.27%の人が含まれているのでばらつきは極めて少ないということになる。
さてではこの 平均±σ=68.27% というのはどこから出てきたのでしょうか?
エクセルには統計で標準偏差をもとめたりする関数とかがあります。
その中で関数
NORMDIST(X 、平均u 、標準偏差σ 、TRUE)
というものを使って考えることができます。
これは(平均 、標準偏差)=(u 、σ)であるときにX以下である確率を値として返してきます。
先の例だと(u 、σ)=(50 、10) Xは適当な値でいいのですが40とすると、
このときでてくる値は 確率 P= 0.1587 = 15.87%
となり、40点以下の人は全体の15.87%(存在確率)いることになります。
この関数が実際に何をやっているかというと、
グラフのX以下の値から-∞までの範囲のデータを積分しているのです。
ちなみに-∞ ~ ∞までを積分すると1という値が返ってきます。
まあ0~100点までしか範囲がないのでこの範囲にいる確率は100%になるのであたりまえの話。
ここでまた正規分布が登場!
正規分布は先に書いたように左右対称形であるものをいうので、
当然反対側の点も積分すれば同じになる。
この場合平均50点に対して40点以下の人を求めたので、
平均点-10点=平均+10点
となるので60点以上の人は同じく全体の15.87%になります。
先に書いたように-∞ ~ ∞を計算すると1になる。(=0~100点の範囲内の得点の人が存在する確率、もちろん100%)
(40点以下の人の確率)と(60点以下の人の確率)を足すと解は、
P≦40 and 60≦P
となり、
これは40点以下と60点以上の確率をあらわす。
P=0.1587+0.1587=0.3174=31.74%
となる。
0~100点の範囲では100%なので、そこから40点以下と60点以上の人の確率を除くとそれは・・・
40点以上60点以下の人の確率になるのです!
40≦P≦60
P=1-0.3174=0.6826=68.26%
すなわち平均u=50において標準偏差σ=10のときに、Xに標準偏差と同じ10をいれると(X=σ)・・・
かならず68.26%となるのです!
よって標準偏差σはu±σの範囲においての存在確率68.26%となる。
すごいぞガウス!
投稿者 nabe : 2007年09月03日 19:34