crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

児童扶養手当受給者データの分析1 - R言語にデータを読み込む。read.csv関数, str関数, function関数, mutate関数などを使用。

今回は、児童扶養手当受給者データを分析しようと思います。

データは、政府統計の総合窓口、www.e-stat.go.jp から取得しました。

政府統計の総合窓口

9月4日の新着ファイルで、厚生労働省から福祉行政報告例というファイルがありましたのでこれをクリックします。

福祉行政報告例

クリックして進んでいきます。

福祉行政報告例

月次の統計です。クリックします。

福祉行政報告例

4月をクリックします。

福祉行政報告例

都道府県別統計表のほうをクリックします。

福祉行政報告例

統計表5が児童扶養手当受給者データです。

児童扶養手当受給者データ

このファイルを上のようなCSVファイルにしました。これをR言語のread.csv関数で読み込みます。

read.csv関数でCSVファイルを読み込む

上のCSVファイルは3行目からがデータなので、skip = 2 として2行を飛ばしています。

UTF-8のエンコードのファイルなので、encoding = "UTF-8"にしています。

str関数で確認してみます。

str関数

str関数でデータの型を見ると、m_sonota, m_iki, f_sonota, f_mikon, f_shogai, f_ikiのデータ型が文字列になっていますね。- があるからですね。- を0に変換して数値型に変えましょう。

function関数でカスタム関数の作成

function関数で - を 0 に変換する関数を作りました。

この関数を使います。

まず、tidyverseパッケージを読み込んでおきます。

tidyverseパッケージ

それでは - を0に変換してみます。

mutate関数

このように、mutate関数内でzero_henkan関数を使います。

もういちど、str関数で確認してみます。

str関数

データ型がnumとなっていて数値型にに代わっています。

最後にそれぞれの変数名の説明を書いておきます。

 type:都道府県(pref)、政令指定都市(large)、中核都市(city)
 name:都道府県、市の名前
 t_pop:受給者数
 m_pop:母子家庭の受給者総数
 m_rikon:母子家庭の離婚世帯の受給者数
 m_sonota:母子家庭のその他世帯受給者数
 m_shibetsu:母子家庭の死別世帯の受給者数
 m_shogai:母子家庭の障碍者世帯の受給者数
 m_iki:母子家庭の遺棄世帯の受給者数
 f_pop:父子家庭の受給者総数
 f_rikon:父子家庭の離婚世帯の受給者数
 f_sonota:父子家庭のその他世帯の受給者数
 f_shibetsu:父子家庭の死別世帯の受給者数
 f_shogai:父子家庭の障碍者世帯の受給者数
 f_iki:父子家庭の遺棄世帯の受給者数
 o_pop:母子家庭、父子家庭以外の世帯の受給者総数

今回は以上です。