Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費者態度指数の分析1 - 基本統計量

今回は、消費者態度指数を分析してみたいと思います。

消費者態度指数は、消費動向調査から算出される指数です。

f:id:cross_hyou:20180630170124j:plain

上の画像は、e-Stat(政府統計の総合窓口)にあった説明文章です。8,400世帯に毎月15日時点で調査を実施しているとのことです。15日に調査をして、月末に発表しているので速報性がありますね。

f:id:cross_hyou:20180630170632j:plain

総世帯、現数値のこのデータファイルを分析に使用しました。

注1に、平成16年から19年2月までの6, 9, 12, 3月以外の月は調査方法が他の月と異なる(電話調査)のため、前月差については注意が必要、とありますので、csvファイルには前月差ではなく、前年同月差を計算しました。下のような感じです。

f:id:cross_hyou:20180630171419j:plain

このcsvファイルをR言語で読込み、基本統計量を算出しようと思います。

read.csv関数で読込み、summary関数で統計サマリーを算出します。

f:id:cross_hyou:20180630171926j:plain

summary関数では、最小値、最大値、平均値、第1分位値、中央値、第3分位値が表示されますが、標準偏差が計算されません。sd関数で標準偏差が計算できます。今回は全ての列にsd関数を適用するようにapply関数を利用していきます。

f:id:cross_hyou:20180630173226j:plain

taidoというデータフレームの1列目は、年で2列目は、月と数値データではないので、taido[ , c(-1,-2)]として1列目と2列目を除外しています。その次の、2というのは列ごとに関数を適用します、と指定する2です。そして、sdが標準偏差を計算する関数ですが、sd関数はデータにNAがあると計算できないので、na.rm=TRUEというのを付けてnaを削除して標準偏差を計算するようにしています。

同じようにして、最小値、最大値、平均値をapply関数で計算したいと思います。

f:id:cross_hyou:20180630174304j:plain

これが最小値です。

 

f:id:cross_hyou:20180630174446j:plain

これが最大値です。

 

f:id:cross_hyou:20180630174624j:plain

これが平均値です。

 

f:id:cross_hyou:20180630174858j:plain

これが中央値です。当然ですが、summary関数で算出した値と同じです。