の続きです。
select関数で、支持率だけのデータフレームを作りました。
apply関数で各調査機関の平均支持率を追加しました。
歴代内閣の中で、発足時支持率の最も高かった内閣は何でしょうか?
小泉内閣が平均支持率81.84%で一番でした。
その反対に一番支持率の低かった内閣は何でしょうか?
宇野内閣が23.075%で一番低いです。
各調査機関によって支持率に違いはあるでしょうか?
まずは、各調査機関のデータがそろっている内閣だけに絞り込みます。
summary関数でサマリを見てみましょう。
meanのところが平均値です。日経新聞が65.0で一番高く、時事通信が48.56で一番低いことがわかります。
分析しやすいように、gather関数で縦長のデータフレームに変換します。
souceの各要素に_forというのがくっついているので、str_remove関数で削除します。
グラフにしてみます。
一番左の時事通信と一番右の日経新聞では、けっこう違う感じですね。
ANOVA分析で、sourceによって、支持率は違うのか確認します。
p値は0.01158です。0.05よりも小さいので、sourceによって支持率に違いがあるといえます。
TukeyHSD関数で、どの調査機関の組み合わせが違いがあるのか調べます。
日経と時事、読売と時事に違いがあると言えます。
今回は以上です。
はじめから読むには、
です。