ここでは、社会心理学のための統計学(清水裕士先生、荘島宏二郎先生)の共分散分析(P91~)について、HADを使って計算する方法を解説しています。あわせてRを使って、HADの出力結果との比較を行っています。
データは、こちらからダウンロードできます。ここでは 3 社会心理学のための統計学の第6章のCSVファイルをダウンロードします。
CSVファイルのデータをすべてコピーして、HADのデータシートに貼り付けます。以下のようになります。ただし、データは一部しか表示されていませんのでご注意ください。
データの読みこみと、使用変数についてはこちらで解説しています。
ここではP106のQuiz 問1について考えてみたいと思います。P104の6.4.3 複数の共変量がある場合も参照してください。
モデリングシートは以下のようになります。
書籍に記載された解答と同じ結果が得られるはずです。
さらにRで重回帰分析をしてみましょう。P103の変数の中心化を参照してください。またsubdat$条件がダミー変数で、1=実験群、0=統制群に割り当てられている点に注意してください。
dat <- read.csv("CSVファイルを指定")
subdat <- subset(dat, select = c(条件,事前テスト,事後テスト,勤続年数))
pretest <- subdat$事前テスト - mean(subdat$事前テスト) # 変数の中心化
years <- subdat$勤続年数 - mean(subdat$勤続年数) # 変数の中心化
result <- lm(subdat$事後テスト ~ subdat$条件 + pretest + years)
summary(result)
その結果がこちら。
Call:
lm(formula = subdat$事後テスト ~ subdat$条件 + pretest + years)
Residuals:
Min 1Q Median 3Q Max
-1.46978 -0.52137 -0.02719 0.51152 1.91292
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.38331 0.29993 17.948 < 2e-16 ***
subdat$条件 1.71939 0.54735 3.141 0.00336 **
pretest 0.52097 0.14649 3.556 0.00108 **
years -0.05844 0.02741 -2.132 0.03989 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7762 on 36 degrees of freedom
Multiple R-squared: 0.2793, Adjusted R-squared: 0.2192
F-statistic: 4.651 on 3 and 36 DF, p-value: 0.00756
まず条件の偏回帰係数(1.72)に注目してください。これは事前テストと勤続年数で統制したときの実験群と、統制群の差分になります。HADで言うと多重比較(Holm法)の差に該当します。
次に、切片の5.38に注目してください。これは統制群の平均値です。HADで言うと水準ごとの平均値の水準=0に出力されています。実験群の平均値はこの5.38に、偏回帰係数の1.72を足して、7.1となります。HADの結果と一致していますね。