今回は都道府県別の県議会議員の所属政党のデータの分析をしてみようと思います。
政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードしました。
新着となっているところをクリックしたところ、下の画像のようになります。
所属党員別人員調(R2.12.31現在)をクリックします。
このようなエクセルファイルをダウンロードできました。これをR言語に読み込ませやすいように、下のように加工しました。
立憲民主党や国民民主党やれいわ新選組は議員がいなかったので削除しています。
これをR言語のread.csv関数で読み込みます。
一番目の変数名がX.U.FEFF.というヘンな文字列がついてしまっているので修正します。
それとNAは0なので0におきかえます。
summary関数でNAがなくなっているかどうかを確認します。
NAがなくなっていることは確認できました。しかし、何故かprefのlengthが54もあります。47都道府県なのにおかしいですね。みてみましょう。
沖縄の後の空白のデータも取り込まれています。削除します。
prefのlengthが47になりました。
各変数が何を意味するか、確認しておきます。
pref: 都道府県名
m_jimin: 男性の自民党(自由民主党)
f_jimin: 女性の自民党
m_komei: 男性の公明党
f_komei: 女性の公明党
m_ishin: 男性の維新の会(日本維新の会)
f_ishin: 女性の維新の会
m_kyosan: 男性の共産党(日本共産党)
f_kyosan: 女性の共産党
m_shamin: 男性の社民党(社会民主党)
f_shamin: 女性の社民党
m_shoha: 男性の諸派
f_shoha: 女性の諸派
m_musho: 男性の無所属
f_musho: 女性の無所属
です。
今回は以上です。
次回は
です。