Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費動向調査データの分析2 - R言語で箱ひげ図を作成する。2008年7月から2010年6月までの24か月は大変だった。

 

www.crosshyou.info

 の続きです。

今回は R言語で箱ひげ図を作成したいと思います。boxplot関数で簡単に箱ひげ図が描かれます。まずは、L5、物価が5%よりももっと下がると思う人の比率です。

f:id:cross_hyou:20190202110252j:plain

f:id:cross_hyou:20190202110304j:plain

6個の外れ値がありますね。でも、同じ値の外れ値が複数あるかもしれません。$outで確認しましょう。

f:id:cross_hyou:20190202113947j:plain

2.1 が2つありましたので、外れ値は 7個でした。

いつのデータでしょうか?データフレームを並び替えて調べてみましょう。order関数を使ってデータフレームを並びかえ、head関数で値の大きな7つの観測値を表示します。

f:id:cross_hyou:20190202114110j:plain



比率が 2.0%以上だと外れ値になっていました。2009年の12月は3.7%の人が5%以上物価が下落すると思っていたのですね。その他、2010年の1月、2009年の5月、4月、6月、2010年の2月、2009年の7月が外れ値でした。

 

次は L52, 物価が5%以上2%未満の範囲で下落すると思っている人の比率です。

f:id:cross_hyou:20190202111849j:plain

f:id:cross_hyou:20190202111908j:plain

外れ値は何個あるでしょうか?str(boxplot(df$L52)$out) というコマンドでわかります。

f:id:cross_hyou:20190202114415j:plain

num [1:21] とありますから、21個の外れ値があることがわかります。

同じように21個の外れ値はどの年月なのか見てみましょう。

f:id:cross_hyou:20190202114549j:plain



比率が 3.3% 以上だと外れ値になっていました。2009年と2010年ですね。リーマンショック後の景気悪化の時期ですね。

 

次は L2 物価が 2% 未満低下すると思っている人の割合です。

f:id:cross_hyou:20190202112901j:plain

f:id:cross_hyou:20190202112915j:plain

外れ値は何個あるでしょうか?

f:id:cross_hyou:20190202114741j:plain

14個外れ値があります。どの年月でしょうか?

f:id:cross_hyou:20190202114933j:plain

やはり、2009年と2010年ですね。最低値は2009年9月の9.6% で、最高値は2009年12月の18.6%です。

 

次は Unch 物価が変わらないと思っている人の割合です。

f:id:cross_hyou:20190202115237j:plain

f:id:cross_hyou:20190202115249j:plain

あ、これは外れ値無いですね。一応確認しておきましょう。

f:id:cross_hyou:20190202115420j:plain

num(0) とありますので、やはり外れ値は無いです。

 

今度はU2 物価が2%未満上昇すると思っている人の比率の箱ひげ図です。

f:id:cross_hyou:20190202120006j:plain

f:id:cross_hyou:20190202120019j:plain


あ、これも外れ値は無いですね。確認しておきましょう。

f:id:cross_hyou:20190202120202j:plain

 

次は U25 物価が 2%以上5%未満上昇すると思っている人の比率です。

f:id:cross_hyou:20190202120453j:plain

f:id:cross_hyou:20190202120508j:plain

これも外れ値は無いですね。いちおう確認しておきましょう。

f:id:cross_hyou:20190202120658j:plain

外れ値はありません。

 

次は U5 物価が5%以上の上昇と思っている人の比率です。

f:id:cross_hyou:20190202121124j:plain

f:id:cross_hyou:20190202121139j:plain

あ!外れ値がありますね。何個かな?確認しましょう。

f:id:cross_hyou:20190202121314j:plain

1つだけですね。42.2%の人が物価が5%以上上がると思ってた時がありました。それはいつでしょうか?

f:id:cross_hyou:20190202121619j:plain

2008年の7月です。 

 

次は、DK わからないという人の比率の箱ひげ図です。

f:id:cross_hyou:20190202122331j:plain

f:id:cross_hyou:20190202122342j:plain

外れ値は無いですね。確認しましょう。

f:id:cross_hyou:20190202122653j:plain

やはり無いです。

ここまで物価の見通しの箱ひげ図と外れ値を観測した年月を見てきました。

外れ値を観測した時期は、物価は下落すると思っているケースに多く見られます。

2009年は全部の月が外れ値でした。2010年は7月8月10月を除く月が外れ値でした。

物価上昇については、2008年7月が外れ値でした。

こうしてみると、2009年と2010年はよっぽど景気が悪かったのですね。

 

それでは、消費者態度指数についても箱ひげ図を作成して外れ値を見てみましょう。

まずは、Index, 消費者態度指数そのものですね。いままではboxplot関数とstr関数のコマンドを別々にしていましたが、実は、str(boxplot(~~~)$out)のコマンドで箱ひげ図も作成できるので、一つだけ表示します。

f:id:cross_hyou:20190202123732j:plain

f:id:cross_hyou:20190202123748j:plain

お~!今度は下の位置に外れ値がありますね。そして、外れ値の個数は9個です。

order関数で並び替えてみましょう。

f:id:cross_hyou:20190202124144j:plain

2008年の12月が一番悪くて、消費者態度指数は 26.7です。31.8以下だと外れ値なのですね。2008年と2009年ですね。

 

次は Live 暮らし向きです。

f:id:cross_hyou:20190202124454j:plain

f:id:cross_hyou:20190202124511j:plain

これも下方に9個の外れ値があります。どの年月でしょうか?

f:id:cross_hyou:20190202124722j:plain

2008年の8月が一番悪く、31.1以下だと外れ値です。2008年と2009年ですね。

 

次は Income 収入の箱ひげ図です。

f:id:cross_hyou:20190202125039j:plain

f:id:cross_hyou:20190202125051j:plain

4つの外れ値があります。年月はいつでしょうか?

f:id:cross_hyou:20190202125251j:plain

2008年12月から2009年3月までの4か月間が外れ値でした。

 

続いて、Empl 雇用環境です。

f:id:cross_hyou:20190202125548j:plain

f:id:cross_hyou:20190202125600j:plain

下方に5つの外れ値があります。年月はいつでしょうか?

f:id:cross_hyou:20190202125846j:plain

2008年11月から2009年3月までの5か月間ですね。

 

Buy 耐久消費財の買い時判断はどうでしょうか?

f:id:cross_hyou:20190202130152j:plain

f:id:cross_hyou:20190202130202j:plain

3つ外れ値があります。いつの時期か調べてみましょう。

f:id:cross_hyou:20190202130452j:plain

2008年7月、8月、10月です。

 

最後は Asset 資産価値の箱ひげ図です。

f:id:cross_hyou:20190202130727j:plain

f:id:cross_hyou:20190202130738j:plain

外れ値が一つありました。いつでしょうか? Asset == 28.1 と条件指定してデータフレーム(df)を表示します。

f:id:cross_hyou:20190202131136j:plain

2008年の12月でした。

以上、消費者態度指数の箱ひげ図と外れ値の時期を見てきましたが、2008年と2009年に外れ値がありました。物価の見通しは2009年と2010年に外れ値がある(42008年7月にU5で外れ値がありました)ことを考えると、消費者態度指数のが先に外れ値が出て、次に物価の見通しに外れ値が出るという順番のようです。

物価の見通しと消費者態度で外れ値があった月を時系列で整理すると、

2008年7月2010年6月までの24か月は何らかの外れ値があり、2か月間を開けて2010年9月に外れ値、1か月あいて、11月12月に外れ値がある、という状況でした。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。