crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

宗教統計調査のデータ分析1 - R言語のread_csv関数でCSVファイルを読み込んでみた。

政府統計の総合窓口、e-Statに「宗教法人統計」というデータが新着でありました。

f:id:cross_hyou:20190306192601j:plain

ちょっと気になったのでクリックしてみました。

f:id:cross_hyou:20190306192741j:plain

宗教統計調査は、毎年の宗教法人数(神社、寺院、教会、布教所など)や宗教法人に関わる教師と信者の人数を調査したもののようです。

データをExcelに出力してみると、

f:id:cross_hyou:20190306193022j:plain

こんなファイルでした。

これを整理して、

f:id:cross_hyou:20190306194550j:plain



このようなファイルを作成しました。

このCSVファイルをR言語で分析してみましょう。

参考にした本は、

 

Rではじめるデータサイエンス

Rではじめるデータサイエンス

  • 作者: Hadley Wickham,Garrett Grolemund,大橋真也,黒川利明
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2017/10/25
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (2件) を見る
 

 これですね。

この本の8章「readrによるデータインポート」を参考にします。

まずは、library(tidyverse)とコマンドを入力して、tidyverseパッケージを読込みます。

f:id:cross_hyou:20190306193932j:plain

CSVファイルの読込みは、read_csv関数を使うようです。

f:id:cross_hyou:20190306194735j:plain

読込みできたようですね。

YearとNumberは数値列、ShokatsuとTypeは文字列です。

表示してみます。

f:id:cross_hyou:20190306194834j:plain

あれ?日本語はうまく読込めていないようです。。。
parse_character関数で日本語に変換できるようです。やってみます。

f:id:cross_hyou:20190306195415j:plain

おお。うまく日本語になりましたね。

summary関数を使ってみます。

f:id:cross_hyou:20190306195653j:plain

あ、ShokatsuとTypeはファクタではなく文字列なのでsummary関数あまり役に立たないですね。factor関数でファクタに変換します。

f:id:cross_hyou:20190306200006j:plain

うまくいきました。

所轄は都道府県知事と文部科学大臣の2種類、

宗教のタイプは、キリスト教系、神道計、仏教系、諸教、都道府県知事合計、文部科学大臣合計、合計の7つあることがわかります。

今回は以上です。
次回は

 

www.crosshyou.info

 

です。

最後に今回のRコマンドを記載しておきます。

# 宗教統計調査
#tidyverseの読込み
library(tidyverse)

# CSVファイルの読込み
df <- read_csv("shuukyou.csv")
df

# 日本語に変換
df$Shokatsu <- parse_character(df$Shokatsu, locale = locale(encoding = "Shift-JIS"))
df$Type <- parse_character(df$Type, locale = locale(encoding = "Shift-JIS"))
df

# summary関数
summary(df)

# ファクタに変換
df$Shokatsu <- factor(df$Shokatsu)
df$Type <- factor(df$Type)
summary(df)