の続きです。
今回は各変数の確認をしましょう。
まずは、調査年が何年なのかを確認します。table関数を使いました。
2006年度から2014年度までのデータです。全部47とありますので、どの年も47都道府県全てそろっています。
調査年がいっぱいあると大変なので、とりあえず一番新しい2014年度のデータだけを分析してみます。
まずは、2014年度だけのデータフレームを作ります。
summary関数でこのデータフレームのサマリを見てみます。
pref, region, ew, jpoは文字列なので、特に見るべきものは無いですが、income, rent_ko, rent_miは数値型データですので、最大値などが表示されます。
incomeは最小値は2081, 208万1千円です。最大値は527万9千円です。へいきんちは275万5千円、中央値は277万4千円です。
rent_koは最小値は832円、最大値は3647円、平均値は1254円、中央値は1455円です。
rent_miは最小値は2913円、最大値は8704円、平均値は4086円、中央値は4371円です。
民間の家賃のほうが高いですね。
table関数でregionの内訳を確認します。
関東が9、近畿が6、九州沖縄が8などとわかります。この出力でもいいですが、もう少し見やすく出力してみます。
tableをdata.frame関数で処理すると、Var1とFreqという変数名のデータフレームになります。arrange関数とdesc関数で大きい順に並び替えました。
ewの内訳を見てみます。
西日本が30、東日本が17です。
jpoの内訳を見てみます。
その他が15で太平洋側が20、日本海側が12です。
今回は以上です。
第1回目は
次回は
です。