www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

法人企業統計の分析12 - 規模と売上高経常利益率でクロス表分析

f:id:cross_hyou:20180519121731j:plain

前回の分析で、企業規模と総資本経常利益率は関係があり、規模の大きいグループは総資本経常利益率も高いグループが多い、ということがわかりました。

今回は、規模と売上高経常利益率の関係を見てみたいと思います。

使用するデータは、2016年度の法人企業統計年報です。

まずは、R言語でデータを読み込みます。

f:id:cross_hyou:20180602111845j:plain

read.csv関数でファイルを読み込み、head関数ではじめの6行を表示し、summary関数でデータの平均値などを表示しています。今日の分析に関係あるデータだけ説明しますと、Uria_Keijiが売上高経常利益率のデータで、最小値が-1.400, 第1分位が3.275, 中央値が4.700, 平均値が6.132, 第3分位が6.800, 最大値が105.300です。Kiboが資本金の規模を表しています。KL1が資本金10億円以上、KL2が1億円以上10億円未満、KL3が5千万円以上1億円未満、KL4が2千万円以上5千万円未満、KL5が1千万円以上2千万円未満です。

クロス表作成のためには、Uria_Keijiの連続数値データをカテゴリカルデータにしなければなりません。cut関数でカテゴリカルデータを作成します。

f:id:cross_hyou:20180602113133j:plain

C_Uria_Keijiという新しい変数名を作成しました。Uria_Keiji_Sが第1分位以下のグループ、Uria_Keiji_Mが第1分位より大きく第3分位以下のグループ、Uria_Keiji_Lのグループが第3分位より大きいグループです。

これで、KiboとC_Uria_Keijiのクロス表を作成します。table関数でクロス表は作成できます。

f:id:cross_hyou:20180602113938j:plain

どうでしょうか?規模の小さいKL5は売上高経常利益率の低いUria_Keiji_Sに多いように見受けられます。帰無仮説H0:規模と売上高経常利益率は関係ない、として検定してみましょう。chisq.test関数でクロス表の独立性が検定できます。

f:id:cross_hyou:20180602114529j:plain

p-value = 0.0001102 < 0.05 ですから、帰無仮説は棄却されます。つまり、規模と売上高経常利益率は関係あります。

それでは、どの組み合わせが有意に関係しているのか、調整済み残差を見てみましょう。chisq.test関数では、$stdresに調整済み残差が格納されています。

f:id:cross_hyou:20180602115032j:plain

調整済み残差は、プラスマイナス2以上の組み合わせが有意であると教えてくれます。売上高経常利益率の低いグループは、規模の大きいKL1が少なく、規模の小さいKL5が多く。売上高経常利益率の中位のグループは、規模の2番目のKL2が多く規模の小さいKL5が少なく。売上高経常利益率の高いグループは、規模の大きいKL1のグループが多い、ということがわかります。

やはり、規模の大きい企業グループのほうが収益性が高いようです。