crosshyou

主にクロス表(分割表)分析をしようかなと思います。

東証株価指数の分析1 - 変化率は正規分布しているか?

法人企業統計、梅雨入り、景気ウォッチャーと分析(のまねごと)してきましたが、実益に結び付けたいな、という邪な考えがわいてきました。

そこで、株価を分析して儲けよう!という無謀なことを企てました。まずは株価データがいるな~と思って探してみたら、e-statの景気動向指数の先行系列に東証株価指数が採用されていることを思い出しました。

早速、e-statのファイルを見てみます。

f:id:cross_hyou:20180616145124j:plain

これが、ww.e-stat.go.jpのサイト画面ですね。この「EXCEL」をクリックするとエクセルがダウンロードされます。

f:id:cross_hyou:20180616145304j:plain

こういうのです。東証株価指数の他にも、新規求人数やマネーストックなどいろいろなデータがあります。

このファイルをR言語で読み込ませて分析しようと思い、このようなcsvファイルを作りました。

f:id:cross_hyou:20180616150519j:plain

Mchgは前月比、Qchgは3ケ月比、Ychgは前年比です。

MupdnはMchgがプラスならUp、マイナスならDnで、Quodn、Yupdnも同じように、Qchgがプラス、YchgがプラスならUp、マイナスならDnです。

このファイルを、Topix.csvと名前をつけて、read.csv関数で読み込み、summary関数でデータのだいたいの様子を見てみましょう。

f:id:cross_hyou:20180616151647j:plain

この結果を見て不思議なのが、YchgでNAの数が15になっていることです。ファイルを見て数えても12しかない。。。私のやり方がおかしいのでしょうか?謎です。

Mupdn、Qupdn、Yupdnを見ると、Yupdnが一番Upの比率が多いです。一般に言われるように、長い期間で見ると株価は上昇していることが多いのでしょうね。

今回は、変化率が正規分布しているかを調べてみようと思いますので、まずは、ヒストグラムで分布の形状を見てみましょう。hist関数を使います。

hits(Topix$Mchg)と入力します。

f:id:cross_hyou:20180616152258j:plain

同じように、hist(Topix$Qchg)でQchgのヒストグラムです。

f:id:cross_hyou:20180616152455j:plain

hist(Topix$Ychg)でYchgのヒストグラムです。

f:id:cross_hyou:20180616152652j:plain

どうでしょうか。。正規分布ではないように感じます。

正規分布しているかどうかは、ks.test関数です。

f:id:cross_hyou:20180616154051j:plain

p-value = 0.002098 < 0.05 なので、Mchgは正規分布に従っている、とはいえません。

f:id:cross_hyou:20180616154152j:plain

p-value = 0.1533 > 0.05 なので、Qchgは正規分布に従っていない、とはいえません。

f:id:cross_hyou:20180616154406j:plain

p-value = 0.5171 > 0.05 なので、Ychgは正規分布に従っていない、とはいえません。

以上の結果から、東証株価指数の変化率は前月比は正規分布に従っていないと言えるが、3ケ月比、前年比は正規分布に従っていない、とは言えないことがわかりました。

この株価指数のデータと景気ウォッチャーのデータや、その他のいろいろなデータを組み合わせていろいろ分析していきたいと思います。