www.crosshyou.infoの続きです。
R Programming By Example: Practical, hands-on projects to help you get started with R
- 作者:Navarro, Omar Trejo
- 発売日: 2017/12/22
- メディア: ペーパーバック
という本を読み始めましたのですが、ここでgrepl関数というのを知ったので、忘れないうちに使ってみようと思います。
grepl関数は文字列の中である文字列が含まれていればTRUEを、含まれていなければFALSEを返す関数です。この関数を使って都道府県を県と都道府に二分して人口密度や1人当りの課税所得などに違いがあるのかどうか調べようと思います。
これで、東京都、北海道、京都府、大阪府はFALSEになっているはずです。
確認してみます。
うまくいきました。
それではMitsuの平均値を比べてみましょう。2016年のデータで比べてみます。
FALSE、つまり都道府のほうが人口密度は高いですね。統計的に有意な違いか調べたいです。
その前にいちいち[df$Year == 2016]とするのは面倒なので、インデックスを作ります。
確認してみます。
インデックスは正しく動いています。
はじめにvar.test関数で分散が同じかどうかを調べます。
for関数で4つの変数を一変に調べます。
どの変数でもp値は0.05以下なので分散が同じとは言えません。
分散が同じとは言えないので、t.test関数ではなくて、wilcox.test関数を使います。
p^value = 2.274e-13と0.05よりも小さいので、県と都道府では人口密度に有意な違いがあります。都道府のほうが人口密度は高いです。
次はperInce, 1人当り課税所得です。はじめに県と都道府の平均値を計算しましょう。
県平均は128万9千円、都道府平均は155万円です。県平均のほうが低いです。
wilcox.test関数で検定します。
p-valueは0.1161と0.05よりも大きいので、1人当り課税所得は違いがあるとは言えません。
次は事業所数(民営) 1~3人です。perSです。
型平均は263か所、都道府平均は248か所です。
wilcox.test関数で検定します。
p-value = 0.2248と0.05よりも大きいです。perSも違いは無いです。
perL, 人口1万人当りの300人以上の事業所数はどうでしょうか?
県平均は0.7か所、都道府平均は1.2か所です。
wilcox.test関数で検定をします。
p-valueは0.03414と0.05よりも低いです。300人以上の事業所数の数は県と都道府では違いがありました。
今回は以上です。