www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

景気ウォッチャー調査分析5 - 数値データをカテゴリーデータに変換する

前回の分析で、景気ウォッチャー調査の現状判断DI(方向性)は正規分布していないことがわかりました。今回は、R言語を使って、

それらのデータをカテゴリーデータに変換してみたいと思います。

ヒストグラムで表示したときに、左に裾が広がっていたので、40以下を超不況、40より大きく50以下を不況、50より大きいデータを好況と3つのカテゴリデータに分けたいと思います。

まずは、read.csv関数でデータを読み込み、summary関数でデータのサマリー(最大値、最小値、平均値、中央値、第1分位、第3分位)を表示してみましょう。

f:id:cross_hyou:20180613201707j:plain

まず、breaks <- c(0, 40, 50, 100)というようにして、0~40, 40~50, 50~100と3つの区切りをしますよ、と設定します。

次に、labels=c("超不況", "不況", "好況")とその3つの区切りの名前を設定します。

そうしたら、cut関数で数値データをカテゴリーデータに変換します。

具体的にはこのように入力します。

f:id:cross_hyou:20180613202722j:plain

同じようにして、残りの9のデータもカテゴリーデータに変換します。

結果はこちらです。

f:id:cross_hyou:20180613204109j:plain

最近の失業率の低下、有効求人倍率の高まりを反映しているのか、C雇用が一番好況の度数が多いですね。逆に超不況が一番多いのは、C飲食です。飲食業は大変なのがわかります。