今回は、都道府県別のボランティア活動行動者率を分析してみます。
政府統計の総合窓口、www.e-stat.go.jpからデータを取得します。
地域は47都道府県です。
取得するデータは、総人口(人)、総面積(ha)、県内総生産額(百万円)、ボランティア活動行動者率(10歳以上)(%)です。
こんな感じのCSVファイルです。9行目に私が変数名の列を入れました。
R言語のread.csv関数でファイルを読み込み、分析します。
ボランティア活動者のデータは、2006年度と2011年度の2つの年度があるようですね。
はじめに、それぞれのデータのベクトルを作成します。
VOLUの最小値は19.70%, 平均値は28.11%, 中央値は27.75%, 最大値は35.50%です。
まずは、年度で違いがあるか、箱ひげ図で目でみてみます。plot関数を使います。
2006年度、2011年度で大きな違いはなさそうですね。
hist関数でヒストグラムを描いてみます。
2006年度のほうが山型って感じで2011年は山というより、丘型という感じですね。
tapply関数で年度別の平均値と標準偏差を見てみます。
2006年度の平均値は、28.16%, 2011年度は28.06%でした。分散と標準偏差は200年度のほうが大きいですね。
var.test関数で両者の分散に違いがあるといえるのか検定してみます。
p-value = 0.8287ですので、両者の分散に違いがある、といは言えません。
両者の分散は同じと考えてよさそうなので、t.test関数で両者の平均値に違いがあるかどうかを検定します。
p-value = 0.6776 なので、両者の平均値に違いがあるとは言えません。
ヒストグラムの形状は少し違っているように見えましたので、wilcox.test関数で分布形状のが同じかどうかを検定します。
p-value = 0.662 なので、両者の分布形状に違いがあるとは言えません。
今回の分析では、10歳以上の人の3割弱、28%ぐらいがボランティア活動をしている、2006年度と2011年度で活動者の比率に大きな変化は無い、ということがわかりました。
今回は以上です。