今回は、消費者態度指数の前年差を上昇・下降の2つのカテゴリカル変数にして、クロス表を作成したいと思います。
まずは、R言語でread.csv関数でデータを読み込みます。読み込んだデータをsummary関数で表示しますね。
前年差のデータは、NAの行があるので、それを削除します。na.omit関数を使います。
NAが削除されているか確認のために、summary関数で指数前年差を表示しました。12個あったNAが削除されていることがわかります。
それでは、各前年差のデータを上昇・下降の2つの値をとるカテゴリカルデータに変換しましょう。cut関数を使います。
まず、breaks = c(-100, 0, 100)と区切る範囲を設定します。-100より大きく0以下、0より大きく100以下という2つの範囲です。
次に、labels = c("下降", "上昇")と2つの範囲の名前を設定します。
そして、cut関数で数値データを上昇・下降のカテゴリカルデータに変換しました。
同じようにして、他の前年差のデータもカテゴリカルデータに変換します。
それでは、指数前年差をカテゴリカル変数にしたカテ指数とそれぞれの前年差をカテゴリカル指数にした、カテ暮らし、カテ収入、カテ雇用、カテ耐久、カテ資産のクロス表を作成してみましょう。
table関数でクロス表は作成できます。
どのクロス表も下降と下降、上昇と上昇の組み合わせが多くなっていて、明らかに指数の上昇・下降と他のデータの上昇・下降は関連しているといえます。カイ自乗検定をして確認してみましょう。いままでの分析では、chisq.test関数でカイ自乗検定をしてきましたが、今回はsummary関数を使ってみましょう。
p-valueはどれも0.05以下なのでどの組み合わせも有意に関連があります。その中でも収入と雇用が一番p-valueが小さいので一番関連があることがわかりました。