政府統計の総合窓口(e-Stat)のサイトを訪問したら、貴金属流通統計調査というデータが更新されていました。
どういうものでしょうか?クリックしてみました。
う~~ん、何も説明はないですね。さらにクリックします。
平成30年01~07月分の金、プラチナ、パラジウムのデータのようですね。ファイルを見てみましょう。
こんな感じのファイルです。これは7月集計ですが、別のSheetに1月集計、2月集計となっています。はっきり言って、分析しにくいです。
金の需要のデータについて、以下のようなCSVファイルを作成しました。
平成29年のファイルには何故か11月と12月のSheetがありませんでした。平成30年のファイルは7月までのデータでした。単位はグラムです。
このデータをR言語に読込ませて分析の練習をしようと思います。
まずは、read.csv関数を使ってデータを読込み、summary関数で要約統計量を表示しましょう。
月の列が数値として読み込まれていますので、ファクターに変換したいと思います。factor関数です。
1月から7月までは平成29年と30年があるので2回あって、8,9,10月は平成29年の1回のみです。summary関数で度数を表示しています。
平均値のベクトルを作成しましょう。apply関数とmean関数を使います。
電気機械で使われる金は月平均で2454キログラムです。歯科医療では618キログラム使われます。メッキは182キログラム、宝飾では640キログラム、美術工芸品では69キログラム使われます。メダルは8キログラムです。
同じようにして、中央値のベクトルも作成します。apply関数とmedian関数を使います。
標準偏差のベクトルも作成しましょう。apply関数とsd関数です。
平均値と標準偏差が計算できたので、変動係数(CV)を計算します。標準偏差 / 平均値です。
メダルの変動係数がダントツに大きいですね。メダルは時々、大量に需要があります。
歯科医療の変動係数が一番小さいです。歯科医療は景気の良し悪しとか関係ないですからね。
最小値、最大値のベクトルも作成しましょう。
最小値はmin関数、最大値はmax関数を使います。
こうして作成した統計値のベクトルを一つのデータフレームにまとめましょう。
行ごとにまとめますので、rbind関数を使います。
round関数を使って、小数点2桁までにしました。