今回は前回に引き続き通信・放送産業動態調査のデータを使います。前回は上半期・下半期でデータの成長に違いはありませんでした。今回は株価の変化とデータの成長は関連があるかどうかを調べてみたいと思います。
まずは、カテゴリカル変数にした各データの度数を確認します。
table関数を使います。
今回は、CTOPIX_CHGとのクロス表を作成します。今回は、xtabs関数を使ってクロス表を作成してみたいと思います。xtabs(~ CTOPIX_CHG + C全体)とコマンド入力します。
TOPIXがマイナス成長のときは、全体もマイナス成長が多く、その反対にTOPIXがプラス成長のときは全体もプラス成長が多いようです。この傾向が統計的に意味のあるものなのか、それともたまたまなのか?今回は、フィッシャーの直接確率検定でやってみたいと思います。fisher.test関数を使います。
p-value = 3.493e-07 < 0.05 ですから、有意です。株価の変化率と全体の成長率は関連性があります。
続いて、電気通信を調べましょう。まずはクロス表です。
これも関連がありそうですね。直接確率検定をしてみます。fisher.test関数です。
p-value = 6.585e-09 < 0.05 ですから有意ですね。
放送はどうでしょうか?
これはあまり違いがない感じですね。直接確率検定をします。
p-value = 0.6185 > 0.05 ですから有意とはいえません。やはり株価と放送は関連性は無いようです。
つぎは民放です。
これもあんまり関連性はないようですね。検定してみましょう。
p-value = 0.8657 > 0.05 です。関連性はないですね。
最後は、ケーブルテレビを調べます。クロス表はこうなりました。
これも関連性はないように感じます。フィッシャーの直接確率検定をしましょう。fisher.testです。
p-value = 0.3457 > 0.05 です。有意ではないです。
以上の結果をまとめると、株価(TOPIX)の変化と関連性のあるデータは、全体と電気通信でした。全体は電気通信と民放とケーブルテレビの合成のようなものですから、株価と関連のあるデータは、電気通信だと言えます。
放送は株価には関連があるとはいえません。