前回の分析で、景気ウォッチャー調査の現状判断DI(方向性)は正規分布していないことがわかりました。今回は、R言語を使って、
それらのデータをカテゴリーデータに変換してみたいと思います。
ヒストグラムで表示したときに、左に裾が広がっていたので、40以下を超不況、40より大きく50以下を不況、50より大きいデータを好況と3つのカテゴリデータに分けたいと思います。
まずは、read.csv関数でデータを読み込み、summary関数でデータのサマリー(最大値、最小値、平均値、中央値、第1分位、第3分位)を表示してみましょう。
まず、breaks <- c(0, 40, 50, 100)というようにして、0~40, 40~50, 50~100と3つの区切りをしますよ、と設定します。
次に、labels=c("超不況", "不況", "好況")とその3つの区切りの名前を設定します。
そうしたら、cut関数で数値データをカテゴリーデータに変換します。
具体的にはこのように入力します。
同じようにして、残りの9のデータもカテゴリーデータに変換します。
結果はこちらです。
最近の失業率の低下、有効求人倍率の高まりを反映しているのか、C雇用が一番好況の度数が多いですね。逆に超不況が一番多いのは、C飲食です。飲食業は大変なのがわかります。