www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

日経の経済指標からデータを取得して分析1 - 日経平均・ドル円・消費支出・鉱工業生産のグラフ(箱ひげ図、ヒストグラム、散布図、小さい順、時系列)

f:id:cross_hyou:20190907125220j:plain

vdata.nikkei.com

今回はこの、日経の経済指標ダッシュボードからデータを保存して分析してみようと思います。

f:id:cross_hyou:20190907131014j:plain

たくさんデータがあるのですが、日経平均(Nikk)、ドル円相場(Yen)、消費支出(Cons)と鉱工業生産指数(IP)の4つを取得しました。最終的には、ドル円相場、消費支出、鉱工業生産の3つの変数で日経平均の騰落を予測するモデルを作りたいな、という野望があります。

早速、read.csv関数でR言語にデータを読込みます。

f:id:cross_hyou:20190907131708j:plain

59か月、約5年分のデータがありますね。Yearは西暦、Monは月です。数値型になっているのをファクタに変換します。

f:id:cross_hyou:20190907132151j:plain

as.factor関数でファクタにしました。

それぞれのデータのグラフを描いてみます。

f:id:cross_hyou:20190907134110j:plain

まずはこのように、plot関数、abline関数、mean関数、median関数、boxplot関数、hist関数を使って4つのグラフを描く関数を作成しました。

では、グラフを描いて、それぞれのデータの様子を確認しましょう。

まずは、日経平均です。

f:id:cross_hyou:20190907134340j:plain

f:id:cross_hyou:20190907134400j:plain

赤い線が平均値、青い線が中央値です。外れ値や、偏りはないようですね。

ドル円はどうでしょうか?

f:id:cross_hyou:20190907134622j:plain

f:id:cross_hyou:20190907134636j:plain

ドル円も外れ値や偏りは無いようです。

消費支出はどうでしょうか?

f:id:cross_hyou:20190907134943j:plain

f:id:cross_hyou:20190907135001j:plain

箱ひげ図を見ると、大小に1つずつ外れ値があります。-10%よりも小さい値はすごいですね。いつのデータが見てみます。

f:id:cross_hyou:20190907135336j:plain

2015年の3月です。

鉱工業生産指数のグラフを描きます。

f:id:cross_hyou:20190907135629j:plain

f:id:cross_hyou:20190907135641j:plain

鉱工業生産は外れ値は無いです。

日経平均とドル円の散布図を見てみます。

f:id:cross_hyou:20190907140858j:plain



まず、上のように、散布図と回帰線、平均値の線を描く関数を作成しました。

それでは、日経平均とドル円の散布図です。

f:id:cross_hyou:20190907141011j:plain

f:id:cross_hyou:20190907141025j:plain

赤い線が回帰線ですが、ほとんど水平ですね。回帰線は必ず2つの平均値がクロスしたところを通ります。

日経平均と消費支出の散布図です

f:id:cross_hyou:20190907141317j:plain

f:id:cross_hyou:20190907141331j:plain

消費支出がプラスになるほど日経平均も高くなっているのがわかります。

日経平均と鉱工業生産はどうでしょうか?

f:id:cross_hyou:20190907141631j:plain

f:id:cross_hyou:20190907141659j:plain

鉱工業生産が高いほど、日経平均も高いですね。

今回は以上です。