今回は医療給付実態調査のデータで、2011年のデータと2016年のデータを比較して各データ項目が増えているか、減っているかを調べてみましょう。
csvファイルに保存してあるデータを、R言語のread.csv関数で読込み、summary関数でデータを要約します。
2011年だけのsummaryを見てみましょう。iryou[iryou$年度 == 2011, ] とすると、2011年だけのデータフレームになりますので、これにsummary関数を適用します。
同じように、2016年だけのデータは、iryou[iryou$年度 == 2016, ]とします。これにsummary関数を適用すると、
となります。
平均値と中央値に注目してみると、
一人当入院医療費は、
平均値:6,2094円(2011年) vs. 6,6321円(2016年)
中央値:3,6590円(2011年) vs. 3,8439円(2016年)
百人当推計新規入院件数は、
平均値:7.722件(2011年) vs. 7.937件(2016年)
中央値:5.600件(2011年) vs. 5.950件(2016年)
推計平均在院日数は、
平均値:21.05日(2011年) vs. 19.50日(2016年)
中央値:16.88日(2011年) vs. 14.76日(2016年)
入院1日当医療費は、
平均値:3,9912円(2011年) vs. 4,5667円(2016年)
中央値:4,0738円(2011年) vs. 4,7536円(2016年)
推計1入院当医療費は、
平均値:74,2207円(2011年) vs. 77,4878円(2016年)
中央値:66,5131円(2011年) vs. 70,5995円(2016年)
となっています。2011年と比較すると、2016年は医療費と件数は増加し、在院日数は短縮したことがわかります。
この傾向は各年齢別に詳しくみたときでもそうでしょうか?
確認してみましょう。
まずは、一人当入院医療費です。2011年の年齢別の平均値は、iryou[iryou$年度 == 2011, ]に対してtapply関数とmean関数を適用します。
まず、2011年だけのデータを、iryou2011という名前で保存し、2016年だけのデータをiryou2016という名前で保存します。
tapply関数でそれぞれの年齢別の平均値を作成しましょう。
こうして、各年度の平均値を作成しました。
一人当入院医療費2016 - 一人当入院医療費2011 とすれば各年齢ごとの差額がでます。
round関数で小数点以下を省略しています。こうしてみると、差額がマイナスの年齢はありません。すべての年齢層で一人当入院医療費は増額しています。
百人当推計新規入院件数はどうでしょうか?おなじようにやってみます。
25歳から29歳と65歳から69歳は件数が減っています。20歳から24歳は変わらずで、残りの12の年齢帯体は増加しています。12増2減1不変です。符号検定をしてみましょう。14の年齢帯のうち12が増です。porp.test関数を使います。
p-value = 0.01616 < 0.05 ですから、2016年の百人当推計新規入院件数は2011年に比べて増加していると言えます。その中で、25歳から29歳、65歳から69歳は件数が減っているのは注目です。
次は、推計平均在院日数を調べます。
すべての年齢帯で、日数が短くなっています。
こんどは、入院1日当医療費を調べましょう。
すべての年齢帯で2016年の医療費が増額しています。
最後は、推計1入院当医療費です。
すべての年齢帯で医療費が増額しています。
年齢帯別に2011年と2016年を比較すると、医療費は増額、在院日数は短縮という傾向であることがわかりました。