Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

日経の経済指標からデータを取得して分析4 - R言語でロジスティック回帰分析、そしてドル円だけが残った。

 

www.crosshyou.info

 の続きです。

今回は日経平均の騰落を回帰分析したいと思います。ロジスティック回帰分析です。

まずは、日経平均の騰落を表すベクトルを作成します。

f:id:cross_hyou:20190914154439j:plain

まず、vNikkの先頭にNAを追加したベクトル、xを作成しました。

これで、vNikk - x で前月比になります。

f:id:cross_hyou:20190914154856j:plain

先頭がNAなので削除します。

f:id:cross_hyou:20190914155016j:plain

できました。

説明変数のvCons, vIP, vYenも先頭を削除してデータの時点を合わせます。

f:id:cross_hyou:20190914155352j:plain

vToraをマイナスなら0, プラスな1に変換します。ifelse関数を使います

f:id:cross_hyou:20190914155937j:plain

平均値が0.58ですから、分析期間中の日経平均は、前月比プラスの月が58%あったということがわかります。

これで準備ができました。R言語でロジスティック回帰分析をするには、glm関数を使います。

 

Statistics: An Introduction Using R

Statistics: An Introduction Using R

 

 この本を参考にして分析します。

f:id:cross_hyou:20190914160426j:plain

vCons:vIP:vYenは削除してもよさそうですね。

f:id:cross_hyou:20190914160623j:plain

ロジスティック回帰分析のモデルをanova関数で比較するときは、test = "Chi"で比較するようです。P値が0.7766ですから、model2を採用します。

f:id:cross_hyou:20190914160832j:plain

vIP:vYenを削除してみます。

f:id:cross_hyou:20190914161018j:plain

p値が0.445と0.05より大きいですから、model3とmode2は有意な差は無いです。なので、model3を採用します。

f:id:cross_hyou:20190914161256j:plain

vCons:vYenの係数のp値は0.0937と0.05よりも大きいですから、これを削除してみます。

f:id:cross_hyou:20190914161513j:plain

p値が0.06238と0,05よりも大きいので、より単純なモデルのmodel4を採用します。

model4を調べます。

f:id:cross_hyou:20190914161712j:plain

vCons:vIPを削除してみましょう。

f:id:cross_hyou:20190914161900j:plain

p値が0.1792と0.05よりも大きいのでmodel5をさらに調べます。

f:id:cross_hyou:20190914162101j:plain

p値が一番大きいvConsを削除しましょう。

f:id:cross_hyou:20190914162243j:plain

p値が0.6404なので、model6を採用し、さらに調べます。

f:id:cross_hyou:20190914162415j:plain

I(vYen^2)を削除しましょう。

f:id:cross_hyou:20190914162607j:plain

p値が0.6854なのでmodel7を調べます。

f:id:cross_hyou:20190914162727j:plain

vIPの係数のp値が0.604と一番大きいので削除します。

f:id:cross_hyou:20190914162920j:plain

p値が0.6032なので、model8を採用して調査を続けます。

f:id:cross_hyou:20190914163057j:plain

I(vCons^2)を削除します。

f:id:cross_hyou:20190914163238j:plain

p値が0.2558なので、model9を採用します。model9を見てみましょう。

f:id:cross_hyou:20190914163401j:plain

I(vIP^2)を削除します。

f:id:cross_hyou:20190914163528j:plain

p値が0.2087と0.05より大きいですから、model10を採用します。model10を見てみましょう。

f:id:cross_hyou:20190914163703j:plain

あ!vYenの係数のp値が0.05よりも大きくなってしまいました!vYenも削除しましょう。

f:id:cross_hyou:20190914163905j:plain

p値が0.04581と0.05よりも小さいですから、vYenを削除するのはよくないということですね。

結局model10が最後のモデルです。

model10のvYenの係数の符号がマイナスですから、円安水準のほうが日経平均は上昇し易いということですね。

グラフで表現してみましょう。

f:id:cross_hyou:20190914164650j:plain

f:id:cross_hyou:20190914164705j:plain

青い線が回帰直線でですが、ダメですね。

株式相場の騰落を予測するのは難しいです。

今回は以上です。