Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

通信・放送産業動態調査の分析7 - 株価の変化と関係あるか?(R言語のxtabs関数とfisher.test関数)

今回は前回に引き続き通信・放送産業動態調査のデータを使います。前回は上半期・下半期でデータの成長に違いはありませんでした。今回は株価の変化とデータの成長は関連があるかどうかを調べてみたいと思います。

まずは、カテゴリカル変数にした各データの度数を確認します。

table関数を使います。

f:id:cross_hyou:20180714130815j:plain

今回は、CTOPIX_CHGとのクロス表を作成します。今回は、xtabs関数を使ってクロス表を作成してみたいと思います。xtabs(~ CTOPIX_CHG + C全体)とコマンド入力します。

f:id:cross_hyou:20180714132025j:plain

TOPIXがマイナス成長のときは、全体もマイナス成長が多く、その反対にTOPIXがプラス成長のときは全体もプラス成長が多いようです。この傾向が統計的に意味のあるものなのか、それともたまたまなのか?今回は、フィッシャーの直接確率検定でやってみたいと思います。fisher.test関数を使います。

f:id:cross_hyou:20180714132756j:plain

p-value = 3.493e-07 < 0.05 ですから、有意です。株価の変化率と全体の成長率は関連性があります。

続いて、電気通信を調べましょう。まずはクロス表です。

f:id:cross_hyou:20180714133245j:plain

これも関連がありそうですね。直接確率検定をしてみます。fisher.test関数です。

f:id:cross_hyou:20180714133510j:plain

p-value = 6.585e-09 < 0.05 ですから有意ですね。

放送はどうでしょうか?

f:id:cross_hyou:20180714133724j:plain

これはあまり違いがない感じですね。直接確率検定をします。

f:id:cross_hyou:20180714133936j:plain

p-value = 0.6185 > 0.05 ですから有意とはいえません。やはり株価と放送は関連性は無いようです。

つぎは民放です。

f:id:cross_hyou:20180714134204j:plain

これもあんまり関連性はないようですね。検定してみましょう。

f:id:cross_hyou:20180714134413j:plain

p-value = 0.8657 > 0.05 です。関連性はないですね。

最後は、ケーブルテレビを調べます。クロス表はこうなりました。

f:id:cross_hyou:20180714134743j:plain

これも関連性はないように感じます。フィッシャーの直接確率検定をしましょう。fisher.testです。

f:id:cross_hyou:20180714135045j:plain

p-value = 0.3457 > 0.05 です。有意ではないです。

以上の結果をまとめると、株価(TOPIX)の変化と関連性のあるデータは、全体と電気通信でした。全体は電気通信と民放とケーブルテレビの合成のようなものですから、株価と関連のあるデータは、電気通信だと言えます。

放送は株価には関連があるとはいえません。