標準化された得点を求める。

Rを用いてデータを標準化された値(標準得点)を求めてみます。

偏差値を求める前に、まずは標準化という手法についてまとめておきます。
標準化というのは、与えられたデータの塊において平均と標準偏差を一定の値になるように変換を行うことです。
この標準化の中でも、平均が0, 標準偏差が1になるような標準化がよく用いられ(この時に得られる値をz得点といいます。)、この変換を行うために以下の式に当てはめます。

z得点 = \frac{データの値 - 平均}{標準偏差}

では、具体的に計算してみます。

scores <- c(1:10)
scores
# 1 2 3 4 5 6 7 8 9 10

ave_scores <- mean(scores)
ave_scores
# 5.5

sd_scores <- sqrt(mean((scores - ave_scores)^2)) # 標準偏差を計算
sd_scores
# 2.8722...

ここまでであるデータの塊scoresに対する平均と標準偏差が求まりました。
標準偏差は一度に計算しましたが、平方根(sqrt)の中に分散(各データから平均を引いたものを2乗して平均を取る)を入れて計算しただけです。

さて、これらを基にz得点を計算してみます。

z_point_scores <- (scores - ave_scores) / sd_scores
z_point_scores
# -1.566 -1.218 -0.870 -0.522 -0.174 0.174 0.522 0.870 1.218 1.566

では、このz得点が本当に平均0、標準偏差1になっているか確かめてみましょう。

mean(z_point_scores)
# 0

sqrt(mean((z_point_scores - mean(z_point_scores))^2))
# 1

というわけで、z得点が計算できたとともに、標準化の手順もわかりました。
同じような方法で偏差値(平均50, 標準偏差10となる標準化した標準得点)も計算できます。


Rによるやさしい統計学
山田 剛史 杉澤 武俊 村井 潤一郎
オーム社
売り上げランキング: 7,330