標準偏差一つ分、二つ分。。。

小児の発達などで登場する-2SDという概念を考察します。

SD = Standard Deviation(標準偏差)

ここで、標準偏差1、平均値0の標準正規分布の確率密度曲線を考えます。

# -SD - SDの区間の確率を計算
> integrate(dnorm,-1,1)
0.6826895 with absolute error < 7.6e-15
# -2SD - 2SDの区間の確率を計算
> integrate(dnorm,-2,2)
0.9544997 with absolute error < 1.8e-11

以上の結果から、母集団の-2SDから2SD以内というのは、母集団のおおよそ95%以内に入るということだと理解できます。

参考に図を描写しておきます。

png("120812_curve.png")
curve(dnorm(x),xlim=c(-5,5))
abline(v=-2,col="green")
abline(v=-2,col="green")
abline(v=-2,col="magenta")
abline(v=2,col="magenta")
dev.off()