Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の県議会議員の所属政党のデータの分析1 - R言語のread.csv関数でデータを読み込む。

今回は都道府県別の県議会議員の所属政党のデータの分析をしてみようと思います。

政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードしました。

f:id:cross_hyou:20210529091821p:plain

新着となっているところをクリックしたところ、下の画像のようになります。

f:id:cross_hyou:20210529091835p:plain

所属党員別人員調(R2.12.31現在)をクリックします。

f:id:cross_hyou:20210529091848p:plain

このようなエクセルファイルをダウンロードできました。これをR言語に読み込ませやすいように、下のように加工しました。

f:id:cross_hyou:20210529091901p:plain

立憲民主党や国民民主党やれいわ新選組は議員がいなかったので削除しています。

これをR言語のread.csv関数で読み込みます。

f:id:cross_hyou:20210529092541p:plain

一番目の変数名がX.U.FEFF.というヘンな文字列がついてしまっているので修正します。

f:id:cross_hyou:20210529092738p:plain

それとNAは0なので0におきかえます。

f:id:cross_hyou:20210529093120p:plain

summary関数でNAがなくなっているかどうかを確認します。

f:id:cross_hyou:20210529093304p:plain

NAがなくなっていることは確認できました。しかし、何故かprefのlengthが54もあります。47都道府県なのにおかしいですね。みてみましょう。

f:id:cross_hyou:20210529093506p:plain

沖縄の後の空白のデータも取り込まれています。削除します。

f:id:cross_hyou:20210529093815p:plain

prefのlengthが47になりました。

各変数が何を意味するか、確認しておきます。

pref: 都道府県名

m_jimin: 男性の自民党(自由民主党)

f_jimin: 女性の自民党

m_komei: 男性の公明党

f_komei: 女性の公明党

m_ishin: 男性の維新の会(日本維新の会)

f_ishin: 女性の維新の会

m_kyosan: 男性の共産党(日本共産党)

f_kyosan: 女性の共産党

m_shamin: 男性の社民党(社会民主党)

f_shamin: 女性の社民党

m_shoha: 男性の諸派

f_shoha: 女性の諸派

m_musho: 男性の無所属

f_musho: 女性の無所属

です。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。