
今回からしばらくは、都道府県別の電子レンジ所有数量を分析してみようと思います。
いつものように、政府統計の総合窓口からデータを取得します。
説明変数に人口密度、県民所得、コンビニエンスストア数、単独世帯割合を選んでみました。

ダウンロードしたCSVファイルは下の図のようなものです。

5行目に変数名を適当に名付けて追加しました。
year: 調査年
pref: 都道府県名
mitsudo: 可住面積1平方㎞当りの人数(人口密度です)【人】
singe: 単独世帯割合【%】
income17: 1人当たり県民所得(平成17年基準)【千円】
income23: 1人当たり県民所得(平成23年基準)【千円】
income27: 1人当たり県民所得(平成27年基準)【千円】
conve: 人口10万人当りのコンビニエンスストア数【所】
microwave: 電子レンジ所有数量(二人以上世帯、千世帯当たり)【台】
です。
このデータをRに読み込み、分析します。
まず、tidyverseパッケージの読み込みをします。

続いて、read_csv()でCSVファイルを読み込みます。

電子レンジ所有数量の分析をしたいので、microwaveがNAの行は削除します。

summary()関数を使ってデータフレームのサマリー統計値を確認します。

あら。。singleが全部、NAですね。つまり、singleの調査年とmicrowaveの調査年が重なっていない、ということですね。これはどうしたものか、考えちゃいます。
今回は以上です。
次回は、
です。
今回のコードは以下になります。
#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# CSVファイルの読み込み
df_raw <- read_csv("microwave.csv",
skip = 4)
#
# microwaveがNAの行は削除
df <- df_raw |>
filter(!is.na(microwave))
#
# サマリー統計量
summary(df)
#
(冒頭の画像は、Bing Image Creatorで生成しました。プロンプトは、Beautiful long long wide view of deep forest, close up of yellow strange shape flowers, photoです。)