今回は、消費者態度指数を分析してみたいと思います。
消費者態度指数は、消費動向調査から算出される指数です。
上の画像は、e-Stat(政府統計の総合窓口)にあった説明文章です。8,400世帯に毎月15日時点で調査を実施しているとのことです。15日に調査をして、月末に発表しているので速報性がありますね。
総世帯、現数値のこのデータファイルを分析に使用しました。
注1に、平成16年から19年2月までの6, 9, 12, 3月以外の月は調査方法が他の月と異なる(電話調査)のため、前月差については注意が必要、とありますので、csvファイルには前月差ではなく、前年同月差を計算しました。下のような感じです。
このcsvファイルをR言語で読込み、基本統計量を算出しようと思います。
read.csv関数で読込み、summary関数で統計サマリーを算出します。
summary関数では、最小値、最大値、平均値、第1分位値、中央値、第3分位値が表示されますが、標準偏差が計算されません。sd関数で標準偏差が計算できます。今回は全ての列にsd関数を適用するようにapply関数を利用していきます。
taidoというデータフレームの1列目は、年で2列目は、月と数値データではないので、taido[ , c(-1,-2)]として1列目と2列目を除外しています。その次の、2というのは列ごとに関数を適用します、と指定する2です。そして、sdが標準偏差を計算する関数ですが、sd関数はデータにNAがあると計算できないので、na.rm=TRUEというのを付けてnaを削除して標準偏差を計算するようにしています。
同じようにして、最小値、最大値、平均値をapply関数で計算したいと思います。
これが最小値です。
これが最大値です。
これが平均値です。
これが中央値です。当然ですが、summary関数で算出した値と同じです。