の続きです。
今回はクロス表を作って、カイ二乗検定をしてみます。
勝利数を
Aクラス・Bクラス x セリーグ・パリーグ、
Aクラス・Bクラス x 関東・非関東
セリーグ・パリーグ x 関東・非関東
この3つのクロス表で分類してカイ二乗検定をします。
まずは、Aクラス・Bクラス x セリーグ・パリーグからやってみます。
tapply関数でクロス表は作成できます。
こうなりました。Aクラスのセリーグの球団の勝利数は217です。
chisq.testでこのクロス表に偏りがあるかどうかを調べます。
p-value = 0.6902 > 0.05 ですから、Aクラス・Bクラスとセリーグ・パリーグに関連性はありません。
次は、Aクラス・Bクラス x 関東・非関東を調べてみます。
あ、Aクラスでは、関東・非関東で勝利数は216, 228と同じくらいなのに、Bクラスでは、264, 128と2倍以上の開きがあります。これは関連性がありそうです。
p-value = 4.863e-08 < 0.05 ですから、Aクラス・Bクラスと関東・非関東は関連性がありますね。Bクラスでは、非関東の球団が勝利数が多いです。
実際のクロス表と、関連性がなかった場合の期待値のクロス表を比較してみます。
Aクラス関東、Bクラス非関東 の勝利数が期待値よりも多いことがわかります。
次は、セリーグ・パリーグ x 関東・非関東のクロス表です。
セリーグでは、関東・非関東の勝利数は207で同数ですが、パリーグでは非関東の勝利数が273, 関東の勝利数が149と大きく違います。
p-value = 1.745e-05 < 0.05 なので有意ですね。セリーグ・パリーグと関東・非関東は関連性があります。
実際のクロス表と、関連性が無かった場合の期待値を比較すると、上のようになります。セリーグ・関東、パリーグ・非関東の勝利数が期待値よりも実際は多いことがわかります。
今回は以上です。