Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東証の規模別・業種別のPER・PBRのデータの分析3 - R で t検定と回帰分析の手法で2022年と2024年の違いを調べる

Bing Image Creator で生成 : beautiful landscape photo, blue sky and blue ocean and red flowers.

www.crosshyou.info

の続きです。前回は箱ひげ図を描いて、2022年と2024年の各データの分布を視覚化しました。

今回は、t検定、回帰分析の手法で統計学的に有意な違いがあるかどうかを調べます。

t検定は、t.test() 関数でやってみます。

まずは、会社数の違いに統計学的に有意な違いがあるかどうかを調べます。

各セクターごとに違いを分析するので、paired = TRUE としています。

p値が0.0007984と非常に小さい値ですので、2022年と2024年では会社数の違いは、統計学的に有意な違いであることがわかります。

PERはどうでしょうか?

p値は0.3304と0.05よりも大きな値です。なのでPERは2022年と2024年で違いがあるとは言えません。

PBRはどうでしょうか?

p値は0.000397と0.05よりもうんと小さな値です。PBRは統計学的に有意な違いがありました。

1社あたりの利益はどうでしょうか?

p値は0.06714です。0.05よりも大きいので、統計学的に有意な違いがあるとは言えません。

1社あたりの株主資本はいかがでしょうか?

p値は0.03465なので、統計学的に有意な違いがあると言えます。

まとめると、

会社数は、p値は0.0007984で有意な違いがある。

PERは、p値は0.3304で有意な違いがあるとは言えない。

PBRは、p値は0.000397で有意な違いがある。

1社あたりの利益は、p値は0.06714で有意な違いがあるとは言えない。

1社あたりの株主資本は、p値は0.03465で有意な違いがある。

となります。

同じように、年による違いがあるかどうかは回帰分析の手法でも確認できます。

普通、回帰分析は、lm() 関数を使うのですが、今回は tidymodels のパッケージを使って実行してみます。

まず、tidymodels のパッケージを読み込みます。

そうしたら、回帰分析のモデルを生成します。

次は、fit() 関数で回帰分析の係数を求めます。

まずは、会社数からです。

fit() 関数で係数を求めたあと、tidy() 関数で係数を tibble 形式に整形し、head() 関数ではじめの2行だけ表示しています。

p値が t.test() 関数と同じだとわかりますね。係数の -5.45 も t.test() 関数の値と(正負の符号が逆ですが)同じです。

同じように、PER以下の変数も実行します。

p値は0.330 で t.test() 関数と同じです。

PBRはどうでしょうか?

p値は0.000397で t.test() 関数と同じです。

1社あたりの利益をみてみます。

p値は0.0671で t.test()関数の値と同じです。

最後は、1社あたりの株主資本です。

p値は0.0346で、やっぱりこれも t.test() 関数と同じです。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。