の続きです。
今回は棒グラフと信頼区間を表示してみたいと思います。
Statistics: An Introduction Using R
- 作者: Michael J. Crawley
- 出版社/メーカー: Wiley
- 発売日: 2019/12/09
- メディア: ペーパーバック
- この商品を含むブログを見る
を参考図書にしてやってみます。
まず、Sector別の短観の平均値をtapply関数とmean関数で計算します。
これをbarplot関数で棒グラフにします。
次に信頼区間を表示する関数を作成します。これがMichael J. Crawleyの本からの関数です。
上の関数でyが棒グラフの部分です。これは今回はsectorbetsuです。zが信頼区間の大きさです。今回は、1standard errorを使います。
aov関数とsummary関数で1standard errorを確認します。
このANOVA表から127がpooled error varianceだとわかります。
こんどは、Sectorがそれぞれ何個あるかをtable関数で確認します。
製造業は228、全産業は12、非製造業は156です。なので、それぞれの1standard errorは、
この3つの値が1standard errorになります。
これで、1標準誤差の表示ができます。
あれれ?三つの標準誤差の線がそれぞれの棒に表示されてしまいまたね。。
あの関数はすべての棒グラフで同じデータ数でないとだめなんですね。
あの関数を改良します。
zもz[i]としないといけなかったですね。
これやってみましょう。
できました!
ちなみに関数をつかわないでarrows関数でひとつひとつ追加するのはこちらです。
1標準誤差をグラフに表示できましたので、今度は95%の信頼区間を表示してみましょう。
まずは、製造業、全産業、非製造業のそれぞれの信頼区間を計算します。
このciをerror_bars2関数に使います。
こうしてグラフで95%信頼区間を表示すると、製造業と全産業、全産業と非製造業には違いは無いかもしれませんが、製造業と非製造業には明らかな違いがあることがわかります。
今回は以上です。