今回はこの、日経の経済指標ダッシュボードからデータを保存して分析してみようと思います。
たくさんデータがあるのですが、日経平均(Nikk)、ドル円相場(Yen)、消費支出(Cons)と鉱工業生産指数(IP)の4つを取得しました。最終的には、ドル円相場、消費支出、鉱工業生産の3つの変数で日経平均の騰落を予測するモデルを作りたいな、という野望があります。
早速、read.csv関数でR言語にデータを読込みます。
59か月、約5年分のデータがありますね。Yearは西暦、Monは月です。数値型になっているのをファクタに変換します。
as.factor関数でファクタにしました。
それぞれのデータのグラフを描いてみます。
まずはこのように、plot関数、abline関数、mean関数、median関数、boxplot関数、hist関数を使って4つのグラフを描く関数を作成しました。
では、グラフを描いて、それぞれのデータの様子を確認しましょう。
まずは、日経平均です。
赤い線が平均値、青い線が中央値です。外れ値や、偏りはないようですね。
ドル円はどうでしょうか?
ドル円も外れ値や偏りは無いようです。
消費支出はどうでしょうか?
箱ひげ図を見ると、大小に1つずつ外れ値があります。-10%よりも小さい値はすごいですね。いつのデータが見てみます。
2015年の3月です。
鉱工業生産指数のグラフを描きます。
鉱工業生産は外れ値は無いです。
日経平均とドル円の散布図を見てみます。
まず、上のように、散布図と回帰線、平均値の線を描く関数を作成しました。
それでは、日経平均とドル円の散布図です。
赤い線が回帰線ですが、ほとんど水平ですね。回帰線は必ず2つの平均値がクロスしたところを通ります。
日経平均と消費支出の散布図です
消費支出がプラスになるほど日経平均も高くなっているのがわかります。
日経平均と鉱工業生産はどうでしょうか?
鉱工業生産が高いほど、日経平均も高いですね。
今回は以上です。