今回は、児童扶養手当受給者データを分析しようと思います。
データは、政府統計の総合窓口、www.e-stat.go.jp から取得しました。
9月4日の新着ファイルで、厚生労働省から福祉行政報告例というファイルがありましたのでこれをクリックします。
クリックして進んでいきます。
月次の統計です。クリックします。
4月をクリックします。
都道府県別統計表のほうをクリックします。
統計表5が児童扶養手当受給者データです。
このファイルを上のようなCSVファイルにしました。これをR言語のread.csv関数で読み込みます。
上のCSVファイルは3行目からがデータなので、skip = 2 として2行を飛ばしています。
UTF-8のエンコードのファイルなので、encoding = "UTF-8"にしています。
str関数で確認してみます。
str関数でデータの型を見ると、m_sonota, m_iki, f_sonota, f_mikon, f_shogai, f_ikiのデータ型が文字列になっていますね。- があるからですね。- を0に変換して数値型に変えましょう。
function関数で - を 0 に変換する関数を作りました。
この関数を使います。
まず、tidyverseパッケージを読み込んでおきます。
それでは - を0に変換してみます。
このように、mutate関数内でzero_henkan関数を使います。
もういちど、str関数で確認してみます。
データ型がnumとなっていて数値型にに代わっています。
最後にそれぞれの変数名の説明を書いておきます。
type:都道府県(pref)、政令指定都市(large)、中核都市(city)
name:都道府県、市の名前
t_pop:受給者数
m_pop:母子家庭の受給者総数
m_rikon:母子家庭の離婚世帯の受給者数
m_sonota:母子家庭のその他世帯受給者数
m_shibetsu:母子家庭の死別世帯の受給者数
m_shogai:母子家庭の障碍者世帯の受給者数
m_iki:母子家庭の遺棄世帯の受給者数
f_pop:父子家庭の受給者総数
f_rikon:父子家庭の離婚世帯の受給者数
f_sonota:父子家庭のその他世帯の受給者数
f_shibetsu:父子家庭の死別世帯の受給者数
f_shogai:父子家庭の障碍者世帯の受給者数
f_iki:父子家庭の遺棄世帯の受給者数
o_pop:母子家庭、父子家庭以外の世帯の受給者総数
今回は以上です。