
Bing Image Creatorで生成:菜の花がいっぱい咲いている、月世界の写真
の続きです。前の2回はClassificationをrpartパッケージとglmnetパッケージを使って実行しました。今回はRegressionを実行してみます。非説明変数をroundnessにして、説明変数をShapeFactor1 ~ 4 にしてやってみましょう。
まずは、基本の線形回帰をRのlm()関数で行います。

roundnessはShapeFactor3と4に関係があるような結果です。Multiple R-squaredの値は0.533なので、roundnessの値の53%はこの回帰分析の推定式で説明できます。
predict()関数を使い、テスト用のデータで値を予測します。

plot()関数で予測結果と実際の値の散布図を描いてみます。


MSE(Mean Squared Error)を計算します。

次はrpartパッケージで決定木のモデルでやってみます。

CPとxerrorの関係をグラフでみてみます。


最適なCPの値を確認します。

この最適なCPで決定木モデルを剪定します。

では、最終的なモデルをみてみましょう。


前々回のClassificationとは違い、今回はかなり枝分かれした木になりました。
このモデルで予測してみます。

予測結果と実際の値の散布図を描きます。


MSEを計算します。

lm()関数での予測のほうが正確な予測でした。
今回は以上です。
初めから読むには、
です。