今回は、医療給付実態調査のデータを使って、年齢別の平均値をグラフにしてみます。まずは、csvファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数にてデータのサマリーを見てみます。
前回までと違うところが一つあります。それは、年齢の各変数を0歳4歳、5歳9歳としていたのから、a.0歳4歳、b.5歳9歳とはじめの文字をa, b, c, ...としたことです。こうすることによって、年齢がきちんと順番どおりに表示されます。
それでは、tapply関数とmean関数を組み合わせて、年齢別の一人当入院医療費の平均値を出しましょう。
barplot関数でグラフにします。
0歳から4歳までが高く、5歳から9歳まででガクンと減って、それからは年齢とともに上昇しています。
次は、百人当推計新規入院件数です。
barplot関数でグラフにします。
だいたいの形は入院費と同じですが、30歳から34歳のところにコブがあります。
次は、推計平均在院日数です。
グラフはこうなります。
50歳から54歳が一番長い在院日数になっています。
次は、入院1日当医療費です。
グラフはこうなります。
これは20歳から24歳が一番低い凹型ですね。
最後は、推計1入院当医療費です。
グラフです。
子どもでは、10歳から14歳が高くなっています。
以上、年齢別のデータの平均値のグラフでした。