Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

各地の気温と降水量の分析1 - 基本統計量(summary関数, apply関数, sd関数, mean関数)

いつものように、e-Stat(政府統計の総合窓口)のウェブサイトを見ていたら、総務省統計局のホームページに迷い込んで、「日本の統計」というページにアクセスしました。

f:id:cross_hyou:20181004184242j:plain

こういう画面です。総務省統計局のホームページから、「統計データ」>>> 「日本の統計」 >>> 「本書の内容」 >>> 「第1章 国土・気象」の画面です。

ここから、気温(平年値)のエクセルファイルを開いてみました。

f:id:cross_hyou:20181004184542j:plain

こういうファイルでした。よさそうですね。

降水量(平年値)のファイルも開いてみました。

f:id:cross_hyou:20181004184709j:plain

同じ形式ですね。

そこで今回はこの気温と降水量のデータを結合させて、R言語で分析(のまねごと)をしてみたいと思います。

f:id:cross_hyou:20181004190119j:plain

このように気温データと降水量データを合わせたCSVファイルを作りました。

これをread.csv関数でR言語に読込みます。

f:id:cross_hyou:20181004190215j:plain

年間平均気温の一番低い値は、8.90℃です。一番高い値は、23.10℃です。14℃ぐらい差があります。日本は南北に長いんですね。

年間降水量が一番少ない値は、933ミリです。多いのは2548ミリです。

最近、1時間に100ミリの猛烈な雨、とテレビでよく聞きましたが、年間降水量の多いところでも2548ミリですから1時間に100ミリの雨っていかに猛烈な雨なのかなんとなくわかりますね。

summary関数を使うと最小値、第1分位値、中央値、平均値、第3分位値、最大値がわかります。標準偏差はsd関数で求めることができます。apply関数と組み合わせて使いましょう。

f:id:cross_hyou:20181004190915j:plain

round関数で小数点2桁にしています。

気温の中で標準偏差が一番大きいのは、2月ですね。一番小さいのは8月ですね。

降水量の中で標準偏差が一番大きいのは6月ですね。一番小さいのは10月ですね。

平均値も計算しましょう。apply関数とmean関数です。

f:id:cross_hyou:20181004191526j:plain

気温が一番低い月は2月で、高いのは8月です。

降水量が一番少ない月は12月で多いのは7月です。

標準偏差を平均値で割った値、変動係数(CV)も計算しましょう。

f:id:cross_hyou:20181004191853j:plain

気温の変動係数が一番小さいのは8月、一番大きいのは1月ですね。

降水量の変動係数が一番小さいのは9月、一番大きいのは12月ですね。

こうしてみると月ごとに特徴があるのがわかりますね。