crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の一般事業投資額のデータ分析1 - R言語で基本統計量を算出。

今回は都道府県別の一般事業投資額のデータを分析したいと思います。

f:id:cross_hyou:20200329104855j:plain

データは政府統計の総合窓口、e-Statから取得しました。

www.e-stat.go.jpここからCSVファイルをダウンロードしました。

f:id:cross_hyou:20200329105114j:plain

各変数名は、

Nen: 調査年

Chi: 地域

Jin: 総人口(人)

Non: 従業も通学もしていない人口(人)

Sho: 1人当り県民所得(千円)

Sala: 賃金・俸給(百万円)

Zai: 財産所得(百万円)

Tou: 一般事業投資額

になります。

R言語のread.csv関数で読み込みます。

f:id:cross_hyou:20200329113940j:plain

read.csv関数で読み込んだあとに、na.omit関数でNAのある行を削除しました。そして、str関数でdfのデータ構造を確認しています。データフレームで、94の観測と8の変数を持つデータです。

従業も通学もしていない人口を実数でなく、総人口に対する割合(%)にしましょう。

f:id:cross_hyou:20200329114716j:plain

round関数で小数点以下2桁にしました。summary関数で最小値などを計算しました。最小値は、28.33%、最大値は、40.36%、平均値は36.39%、中央値は36.37%です。

1人当りの賃金・俸給(百万円)を求めます。

f:id:cross_hyou:20200329115311j:plain

最小値は、115万4千円、最大値は222万8千円、平均値は157万1千円、中央値は157万0千円です。

1人当りの財産所得(百万円)を求めます。

f:id:cross_hyou:20200329115805j:plain

最小値は、7万5千円、最大値は62万2千円、平均値は15万05百円、中央値は13万6千円です。

一人当たりの一般事業総投資額を求めます。

f:id:cross_hyou:20200329120419j:plain

最小値は7万1910円、最大値は、58万9400円、中央値は18万1250円、平均値は18万8570円です。

1人当りの県民所得の平均値なども求めましょう。

f:id:cross_hyou:20200329120847j:plain

最小値は198万1千円、最大値は537万8千円、平均値は276万1千円、中央値は272万0千円でした。

ここで分析で使う変数を整理しましょう。

Nen, Chi, Sho, Non2, Sala2, Zai2, Tou2ですね。

Nen(調査年)はファクタですが、要素が0の水準も残っていますから、整理します。

f:id:cross_hyou:20200329121633j:plain

調査年は、2010年度と2015年度の2つだけですね。

今回は以上です。