Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の学歴と収入のデータ分析5 - R言語で相関関係を調べる。pairs関数の応用

 

www.crosshyou.info

 の続きです。

今回は、変数間の相関関係を調べてみます。

R言語のcor関数で相関係数マトリックス

一番左の列を見ますと、Average:平均収入との相関係数になります。Middle_Ratio:高校卒の比率は-0.263で負の相関、Adavance_Ratio:短大・高専卒の比率は0.248で正の相関、HIgh_Advance_Ratio:大学・大学院卒の比率との相関は0.471で正の相関です。

pairs関数で散布図マトリックスを見ます。

pais関数で散布図マトリックスを作成

散布図マトリックス

右上の九つの散布図は興味のある散布図ですね。

help(pairs)と入力すると、いろいろと面白いことができそうなのでやってみます。

まずは、右上の九つの散布図だけを表示します。これは、horIndで水平方向の散布図を指定、varIndで上下方向の散布図を指定できるようです。右上の九つの散布図は、水平方向は4, 5, 6です。上下方向は1, 2, 3です。

horIndとvarIdのパラメータ

右上の九つの散布図

はい、うまくできました。

他にもpairs関数のヘルプページには面白いことがあったのでやってみます。

対角線上にヒストグラムを描く関数

対角線上にヒストグラム

panel.histという関数を作成して、対角線上にヒストグラムを描くこともできます。


相関係数を計算する関数

ヒストグラム・相関係数もある散布図マトリックス

このように、相関係数を計算して表示する関数、panel.corを作成して、panel.histと組み合わせて表示することが可能です。

今回は以上です。