今回も前回に引き続き、「日本の統計」の各地の気温と降水量のデータを使って、R言語の操作の練習をします。
まずは、read.csv関数でCSVファイルに保存してあるデータを読込みます。そして、それをsummary関数で基本統計量を算出します。
このsummary関数の結果を見ると、平均気温が一番低い月は2月などとわかります。
今回は、都市ごとに一番平均気温が高い都市、一番降水量が多い都市がどこかを調べてみましょう。
まずは簡単に年間平均気温の高いところはどこか調べましょう。
まず、平均気温のベクトルを作り、names関数でそれぞれの要素に都市名を付与しました。あとは、sort関数で並び替えるだけです。
平均気温の低い順に並び替えました。札幌が一番低く、8.9℃です。那覇が一番高く23.1℃です。
年間降水量も同じようにやってみましょう。
長野が一番雨が少ないのですね。一番多いのは高知だとわかります。
平均気温の棒グラフ、年間降水量の棒グラフを作成してみましょう。barplot関数です。
ヒストグラムを作ってみましょう。hist関数です。
hist関数で、labels=TRUEを加えると、このように度数も表示されます。
箱ひげ図を作成しましょう。boxplot関数です。
外れ値が上に一つ、下に三つありますね。上の外れ値は那覇、下の外れ値は札幌、盛岡、青森ですね。
年間降水量の箱ひげ図も作ります。
年間降水量には外れ値は無いですね。
では、それぞれの都市の最高気温、最低気温、最大降水量、最小降水量を調べてみましょう。
max関数で最大値、min関数で最小値がわかりますので、apply関数と組み合わせて算出します。
dataのデータフレームでは、3列目が1月の平均気温で14列目が12月の平均気温なのでdata( , c(3:14)]としてその列だけで計算するようにしています。那覇が最高気温でも一番高いですが、注目はその次の大阪です。やっぱり大阪の夏って暑いんですね。
最低気温はどうでしょうか?同じようにやりましょう。
札幌の平均気温が-3.6℃で一番低いですね。盛岡、青森、長野と続きます。
最大降水量の都市はどこでしょうか?
鹿児島が最大降水県ですね、宮崎、熊本と九州が続きます。九州は台風がよく来るし雨が多いですね。
最小降水量の都市はどこでしょうか?
前橋は雨が降らない月は23ミリしか降らないんですね。熊谷、岡山、甲府と続きます。