Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の1人当りの県民所得と賃貸住宅の家賃のデータ分析2 - R言語のsummary関数とtable関数でデータの概要を見る。

 

www.crosshyou.info

 の続きです。

今回は各変数の確認をしましょう。

まずは、調査年が何年なのかを確認します。table関数を使いました。

f:id:cross_hyou:20201219122746p:plain

2006年度から2014年度までのデータです。全部47とありますので、どの年も47都道府県全てそろっています。

調査年がいっぱいあると大変なので、とりあえず一番新しい2014年度のデータだけを分析してみます。

まずは、2014年度だけのデータフレームを作ります。

f:id:cross_hyou:20201219123200p:plain

summary関数でこのデータフレームのサマリを見てみます。

f:id:cross_hyou:20201219123310p:plain

pref, region, ew, jpoは文字列なので、特に見るべきものは無いですが、income, rent_ko, rent_miは数値型データですので、最大値などが表示されます。

incomeは最小値は2081, 208万1千円です。最大値は527万9千円です。へいきんちは275万5千円、中央値は277万4千円です。

rent_koは最小値は832円、最大値は3647円、平均値は1254円、中央値は1455円です。

rent_miは最小値は2913円、最大値は8704円、平均値は4086円、中央値は4371円です。

民間の家賃のほうが高いですね。

table関数でregionの内訳を確認します。

f:id:cross_hyou:20201219124021p:plain

関東が9、近畿が6、九州沖縄が8などとわかります。この出力でもいいですが、もう少し見やすく出力してみます。

f:id:cross_hyou:20201219124238p:plain

tableをdata.frame関数で処理すると、Var1とFreqという変数名のデータフレームになります。arrange関数とdesc関数で大きい順に並び替えました。

ewの内訳を見てみます。

f:id:cross_hyou:20201219124517p:plain

西日本が30、東日本が17です。

jpoの内訳を見てみます。

f:id:cross_hyou:20201219124623p:plain

その他が15で太平洋側が20、日本海側が12です。

今回は以上です。

第1回目は

 

www.crosshyou.infoです。

 次回は

 

www.crosshyou.info

 です。