crosshyou

主にクロス表(分割表)分析をしようかなと思います。

貴金属流通統計調査の分析1 - 基本統計量(summary関数、mean関数、median関数、sd関数、min関数、max関数)

政府統計の総合窓口(e-Stat)のサイトを訪問したら、貴金属流通統計調査というデータが更新されていました。

f:id:cross_hyou:20180915122008j:plain

どういうものでしょうか?クリックしてみました。

f:id:cross_hyou:20180915122102j:plain

う~~ん、何も説明はないですね。さらにクリックします。

f:id:cross_hyou:20180915122248j:plain

平成30年01~07月分の金、プラチナ、パラジウムのデータのようですね。ファイルを見てみましょう。

f:id:cross_hyou:20180915122440j:plain

こんな感じのファイルです。これは7月集計ですが、別のSheetに1月集計、2月集計となっています。はっきり言って、分析しにくいです。

金の需要のデータについて、以下のようなCSVファイルを作成しました。

f:id:cross_hyou:20180915125828j:plain

平成29年のファイルには何故か11月と12月のSheetがありませんでした。平成30年のファイルは7月までのデータでした。単位はグラムです。

このデータをR言語に読込ませて分析の練習をしようと思います。

まずは、read.csv関数を使ってデータを読込み、summary関数で要約統計量を表示しましょう。

f:id:cross_hyou:20180915130455j:plain

月の列が数値として読み込まれていますので、ファクターに変換したいと思います。factor関数です。

f:id:cross_hyou:20180915130731j:plain

1月から7月までは平成29年と30年があるので2回あって、8,9,10月は平成29年の1回のみです。summary関数で度数を表示しています。

平均値のベクトルを作成しましょう。apply関数とmean関数を使います。

f:id:cross_hyou:20180915131432j:plain

電気機械で使われる金は月平均で2454キログラムです。歯科医療では618キログラム使われます。メッキは182キログラム、宝飾では640キログラム、美術工芸品では69キログラム使われます。メダルは8キログラムです。

 

同じようにして、中央値のベクトルも作成します。apply関数とmedian関数を使います。

f:id:cross_hyou:20180915131719j:plain

標準偏差のベクトルも作成しましょう。apply関数とsd関数です。

f:id:cross_hyou:20180915132406j:plain

 

平均値と標準偏差が計算できたので、変動係数(CV)を計算します。標準偏差 / 平均値です。

f:id:cross_hyou:20180915132928j:plain

メダルの変動係数がダントツに大きいですね。メダルは時々、大量に需要があります。

歯科医療の変動係数が一番小さいです。歯科医療は景気の良し悪しとか関係ないですからね。

最小値、最大値のベクトルも作成しましょう。

最小値はmin関数、最大値はmax関数を使います。

f:id:cross_hyou:20180915134414j:plain

こうして作成した統計値のベクトルを一つのデータフレームにまとめましょう。

行ごとにまとめますので、rbind関数を使います。

f:id:cross_hyou:20180915135135j:plain

round関数を使って、小数点2桁までにしました。