crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のデジタル教科書の整備率のデータの分析1 - R言語のread_csv関数でCSVファイルのデータを読み込む。

今回は都道府県別のデジタル教科書の整備率のデータの分析をしてみようと思います。

データは、政府統計の総合窓口(www.e-stat.go.jp)から取得しました。

f:id:cross_hyou:20210123101235p:plain

47都道府県を選択し、

f:id:cross_hyou:20210123101312p:plain

デジタル教科書の整備率と関連のありそうな教育用コンピュータ1台当たりの児童数のデータも選択しました。

f:id:cross_hyou:20210123101428p:plain

このようなデータです。

これをCSVファイルに出力しました。

f:id:cross_hyou:20210123101515p:plain

9行目に変数名を挿入しています。

これをR言語のread_csv関数で読み込みます。

f:id:cross_hyou:20210123102102p:plain

read_csv関数でCSVファイルを読み込みます。

f:id:cross_hyou:20210123102410p:plain

skip = 8 で9行目から読み込むように、

na = c("***", "X", "-") で***, X, - はNAとするように、

locale = locale(encodding = "UTF-8")でUTF-8がエンコードだと指定しています。

year: 調査年度

pref: 都道府県名

pc_s: 教育用コンピュータ1台当たりの児童数(小学校)(人)

pc_c: 教育用コンピュータ1台当たりの児童数(中学校)(人)

pc_h: 教育用コンピュータ1台当たりの児童数(高等学校)(人)

dg_s: デジタル教科書の整備率(小学校)(%)

dg_c: デジタル教科書の整備率(中学校)(%)

dg_h: デジタル教科書の整備率(高等学校)(%)

です。

raw_dfは原データなので、とっておいて分析用のデータフレームを作ります。

とりあえず、NAの行をna.omit関数で削除して、yearとprefをファクター型に変換します。

f:id:cross_hyou:20210123103333p:plain

summary関数で基本統計量をみてみます。

f:id:cross_hyou:20210123103556p:plain

デジタル教科書の整備率は小学校、中学校、高等学校で最大値が100ですから100%整備した都道府県があるということですね。

平均値は小学校が49.4%, 中学校が53.5%, 高等学校が11.78%となっています。高等学校は整備が遅れているようです。

コンピュータ1台当たりの児童数は、高等学校が最小で0.7と児童数よりもコンピュータの台数が多いところがあるようです。

平均値は小学校が6.446人, 中学校が5.708人, 高等学校が4.924人と高等学校のほうがコンピュータは普及しているようです。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。