Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の電子レンジ所有数量のデータの分析1 - RでCSVファイルからデータを読み込む。

今回からしばらくは、都道府県別の電子レンジ所有数量を分析してみようと思います。

いつものように、政府統計の総合窓口からデータを取得します。

説明変数に人口密度、県民所得、コンビニエンスストア数、単独世帯割合を選んでみました。

ダウンロードしたCSVファイルは下の図のようなものです。

5行目に変数名を適当に名付けて追加しました。

year: 調査年

pref: 都道府県名

mitsudo: 可住面積1平方㎞当りの人数(人口密度です)【人】

singe: 単独世帯割合【%】

income17: 1人当たり県民所得(平成17年基準)【千円】

income23: 1人当たり県民所得(平成23年基準)【千円】

income27: 1人当たり県民所得(平成27年基準)【千円】

conve: 人口10万人当りのコンビニエンスストア数【所】

microwave: 電子レンジ所有数量(二人以上世帯、千世帯当たり)【台】

です。

このデータをRに読み込み、分析します。

まず、tidyverseパッケージの読み込みをします。

続いて、read_csv()でCSVファイルを読み込みます。

電子レンジ所有数量の分析をしたいので、microwaveがNAの行は削除します。

summary()関数を使ってデータフレームのサマリー統計値を確認します。

あら。。singleが全部、NAですね。つまり、singleの調査年とmicrowaveの調査年が重なっていない、ということですね。これはどうしたものか、考えちゃいます。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# CSVファイルの読み込み
df_raw <- read_csv("microwave.csv",
                   skip = 4)
#
# microwaveがNAの行は削除
df <- df_raw |> 
  filter(!is.na(microwave))
#
# サマリー統計量
summary(df)
#

(冒頭の画像は、Bing Image Creatorで生成しました。プロンプトは、Beautiful long long wide view of deep forest, close up of yellow strange shape flowers, photoです。)