2021-04-01から1ヶ月間の記事一覧
www.crosshyou.info の続きです。 このようなCSVファイルを用意しました。今後も日本語が文字化けしてしまう事態が想定されますので、都道府県コードと英語の都道府県名を用意しました。せっかくなので、ew(東日本か西日本か)とbig3(東京都、愛知県、大阪府)…
今回は都道府県別の消費者物価指数、その中の教養娯楽のデータを分析してみます。 政府統計の総合窓口(e-stat)のからデータをダウンロードしました。 www.e-stat.go.jp まず、都道府県を指定して、 総人口、県内総生産額、消費者物価指数の総合と教養娯楽の4…
www.crosshyou.info の続きです。 前回の分析では、小学校費の県内総生産額に対する割合は、人口や県内総生産額とは無関係だとわかりました。 そこで、今回は小学校の数を説明変数に加えてみます。 まず、政府統計の総合窓口、www.e-stat.go.jp のサイトから…
www.crosshyou.info の続きです。 前回の分析で、小学校費は、人口の少ない県のほうが一人当たり小学校費が多く、県内総生産額の小さい県のほうが県内総生産額に占める割合が高いことがわかりました。 これをR言語の回帰分析関数のlm関数で分析してみます。 …
www.crosshyou.info の続きです。 pref: 都道府県ごとのper: 県民一人当たりの小学校費をみてみましょう。 島根県、高知県、鹿児島県などが金額が多く、神奈川県、埼玉県、大阪府、東京都などが金額が少ないことがわかります。 人口が多い県ほど少ない感じで…
www.crosshyou.info の続きです。 今回は、県民一人当たりの小学校費と、県内総生産額に対する割合を算出してみましょう。 まず、都道府県財政の小学校費と市町村財政の小学校費を合計した変数を作ります。mutate関数を使ってみました。totalという変数名に…
今回は都道府県別の小学校費のデータを分析します。 政府統計の総合窓口(www.e-stat.go.jp)からデータを取り込みます。 47都道府県を選択します。 総人口(人)、可住地面積(ha)、県内総生産額(H17年基準、百万円)、小学校費(都道府県財政、千円)、小学校費(市…
www.crosshyou.info の続きです。 mgcvパッケージの読み込みをしてgam関数をつかって、generlized additive modelを作って男性、女性を予測してみます。 gam関数をつかってモデルを作ります。 このモデルでpredict関数を使い予測してみましょう。 confusionM…
www.crosshyou.info の続きです。 今回はランダムフォレストを使って男性、女性を予測します。 まずは、randomForestパッケージの読み込みです。 randomForest関数でモデルを作ります。 plot関数で作成されたモデルをみてみます。 predict関数で予測します。…
www.crosshyou.info の続きです。 今回はrpart関数で決定木モデルをつくり、男性、女性を予測してみます。 rpartパッケージの読み込みをします。 rpart関数でモデルを作ります。 plot関数とtext関数でモデルをグラフであらわします。 wageが1082よりも小さく…
www.crosshyou.info の続きです。前回はknn3関数でk-nearest neighborのアルゴリズムで男性か女性かを予測してみました。正解率は、68%でした。 今回はcaretパッケージのtrain関数をつかって、linear discriminant analysis(LDA)のモデルでやってみましょう…
www.crosshyou.info の続きです。前回はlm関数で男性か女性かを分類するモデルを作りました。正解率は88%でした。 今回はknn3関数でk-nearest neighborsモデルを作り、同じようにやってみます。 まず。knn3関数はcaretパッケージにあるので、caretパッケージ…
www.crosshyou.info の続きです。前回の分析で、女性の給与は男性よりも確かに低いことがわかりました。 今回は、R言語のlm関数で男性か女性かを分類するモデルを作ってみます。 まず、mutate関数とifelse関数でgendarをm, f ではなくて1, 0という2つの数値…
www.crosshyou.info の続きです。 今回はR言語のlm関数を使って、wage: 1時間当たりの給与額を他の変数で回帰分析しようと思います。gendar: 男女の区別 がwageに影響しているのかどうかを確かめます。 summary関数でlm_model1を見てみましょう。 一番下のp…
www.crosshyou.info の続きです。 前回はR言語gather関数とinner_join関数でロング型のデータフレームを作りました。 そのデータフレームにもう少し手を加えます。 このデータフレームは、企業規模にallという全部のものと産業コードにTという全産業というも…
www.crosshyou.info の続きです。 今回はR言語のgather関数とinner_join関数を使ってデータフレームをワイド型からロング型に変換します。 ワイド型というのは、 こんな感じのデータです。 ロング型というのは こんな感じのデータです。 前回作成したデータ…
賃金構造基本統計調査 平成21年賃金構造基本統計調査 短時間労働者 都道府県別1 短時間労働者の1時間当たり所定内給与額及び年間賞与その他特別給与額 全国 | 統計表・グラフ表示 | 政府統計の総合窓口 (e-stat.go.jp) 今回はこのデータの分析をしてみようと…