crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

図書館数と図書館登録人数のデータの分析 - 神奈川は図書館少ない、山梨は多い。青森県は登録人数比率が低く、富山県は多い。

今回は、各都道府県の図書館の数と図書館登録人数を調べようと思います。

政府統計の総合窓口、e-Statからデータを取得します。

f:id:cross_hyou:20190615103848j:plain

総人口と図書館数と図書館登録者数です。

f:id:cross_hyou:20190615103922j:plain

エクセルにこのようにデータを取得しました。

read.csv関数でR言語にデータを読込み、分析します。

f:id:cross_hyou:20190615104833j:plain

事前のCSVファイルを眺めたのですが、図書館数と図書館登録人数は同じ年には調査されていないようで、年度データでは、どちらか一方しかありませんでした。

そこで、今回は、図書館数と図書館登録人数を別々に分析しようと思います。

まず、Year(年度), Pref(都道府県), Pop(人口), Kan(図書館数)のデータフレームを作って、na.omit関数でNAのデータを削除します。

f:id:cross_hyou:20190615105441j:plain

Yearを見ると、1975年度、1978年度、1981年度と3年ごとのデータのようです。

図書館登録人数のデータフレームを作ります。

f:id:cross_hyou:20190615105740j:plain

図書館登録人数は、2007年度、2010年度、2014年度の3回しかデータが無いですね。

一番新しい、204年度のデータだけにしてしまいます。

f:id:cross_hyou:20190615110203j:plain

図書館数は一番新しい年度は何年でしょうか?summary関数でみてみます。

f:id:cross_hyou:20190615110428j:plain

2015年度が一番新しいです。2015年だけのデータフレームを作ります。

f:id:cross_hyou:20190615110720j:plain

こうして作成した、df2015とdf2014をmerge関数で結合します。

f:id:cross_hyou:20190615111207j:plain

Pop.xが2015年の人口、Pop.yが2014年の人口です。colnames関数で名前を変更します。

f:id:cross_hyou:20190615111549j:plain

人口と図書館数の散布図を描いてみます。plot関数です。

f:id:cross_hyou:20190615111832j:plain

f:id:cross_hyou:20190615111844j:plain

人口が多いほど、図書館の数も多いです。

人口と図書館登録人数の散布図も描いてみます。

f:id:cross_hyou:20190615112431j:plain

f:id:cross_hyou:20190615112441j:plain

こちらも、人口が多いと図書館登録人数が多いですね。

まずは、人口当りの図書館数を計算して、どこの都道府県が図書館が多いか少ないかを調べましょう。

f:id:cross_hyou:20190615113202j:plain

KanPopという10万人当りの図書館数のベクトルを作成し、names関数でそのベクトルに都道府県の名前を付けて、sort関数で小さい順に表示しています。神奈川県は10万人当り0.9しか図書館ないですが、山梨県は6.6もあります。

 

次は、図書館登録人数 / 人口をやってみます。

f:id:cross_hyou:20190615113706j:plain

パーセンテージ表示です。青森県は人口の10%しか図書館登録がなく、富山県は人口の56%が図書館登録あります。都道府県によってこんなに違うのですね。

hist関数で人口10万人当りの図書館数、図書館登録人数比率のヒストグラムを描いてみます。

f:id:cross_hyou:20190615114313j:plain

f:id:cross_hyou:20190615114325j:plain

人口10万人当りの図書館数(KanPop)のほうが左右対称に近いですね。図書館登録人数比率(HitoPop)は左に山の頂点がよっています。

KanPopとHitoPopの散布図を描いてみます。

f:id:cross_hyou:20190615114700j:plain

f:id:cross_hyou:20190615114710j:plain

結構分散していますね。

今回は以上です。