2020-09-01から1ヶ月間の記事一覧
www.crosshyou.info の続きです。 今回は、各変数の分布をヒストグラムを作成して見てみましょう。 ggplot2パッケージのgeom_histogram関数とfacet_grid関数を使いました。 1人当りの県民所得のヒストグラムです。2009年度、2011年度、2014年度と年を経過す…
今回は、都道府県別の1人当りの県民所得と従業者人数別事業所割合のデータを調べようと思います。 政府統計の総合窓口、e-statからCSVファイルを取得しました。 取得したデータは上の図のとおりです。 CSVファイルは以下のようになります。 このCSVファイル…
www.crosshyou.info 今回は、gganimateパッケージを使ってアニメーショングラフを作成してみます。 https://towardsdatascience.com/animated-charts-visualizing-changes-in-r-fee659fbabe5 と https://www.datanovia.com/en/blog/gganimate-how-to-create-…
www.crosshyou.info の続きです。 今回は2000年から2017年の間で、basicの比率が一番上昇したのはどこの国かを調べてみます。 コードは以下のようになります。 始めにnames(df)[1] <- "country"で変数名をcountryに直しておきます。 次にdf %>% filter(year …
www.crosshyou.info の続きです。 今回は、普通にlm関数を使って回帰分析をしてみます。 p-value < 2.23-16と0.05よりも小さいので有意なモデルです。urban_rate:year2009とurban_rate:year2017は必要ないようです。update関数で削除します。 update関数で、…
www.crosshyou.info の続きです。 今回は、tidymodelsパッケージを使ってみようと思います。 https://www.tidymodels.org/start/models/ このサイトを参考にしてみます。 このサイトはウニの大きさ(数値データ)をもともとの大きさ(数値データ)と食べ物の種類…
washdata.orgのデータ分析2 - R言語のggplot2パッケージのfacet_grid関数、geom_boxplot関数、geom_histogram関数、geom_point関数を使う。
www.crosshyou.info の続きです。 データをいろいろとグラフにしてみましょう。 basicの箱ひげ図を描いでみます。ggplot2パッケージの中のgeom_boxplot関数とfacet_grid関数を使いました。 年が進むにつれて、だんだんとbasicの最低値が大きくなっていること…
https://washdata.org/data/downloads#WLD WHOとUNICEFのジョイントプログラムのウェブサイトに世界各国の水利用関連のデータファイルがあります。 今回はこのファイルをR言語に読み込んでみようと思います。 こういうExcelファイルです。 このファイルを読…
www.crosshyou.info の続きです。 今回はR言語のlm関数で回帰分析をしてみます。 2014年のincome(二人以上の世帯の年間収入のジニ係数)を、2009年のジニ係数で回帰分析してみます。 はじめに2014年のincome, 2009年のincomeのベクトルを作ります。 income201…
www.crosshyou.info の続きです。 今回は、R言語のggplot2パッケージを読み込んでgeom_point関数とgeom_text関数で散布図を描いてみましょう。 まずは、2014年度のincome(二人以上の世帯の年間収入のジニ係数)とsaving(二人以上の世帯の貯蓄現在高のジニ係数…
www.crosshyou.info の続きです。 今回はR言語のarrange関数を使って、ジニ係数の大きい順、小さい順に都道府県を並べてみます。 income(二人以上の世帯の年間収入のジニ係数)の大きい都道府県はどこでしょうか? 2014年度の東京都が一番大きい、つまり格差…
www.crosshyou.info の続きです。 前回のヒストグラムを見ると、現在貯蓄現在高のジニ係数は2014年度のほうが大きくなっているようでした。 今回はR言語で統計的に有意に違っているのかを検定してみます。 はじめに、group_by関数+summarize関数+mean関数で…
www.crosshyou.info の続きです。 今回は4つのジニ係数データのヒストグラム描いてみます。 geom_histogram関数でヒストグラムを作り、facet_grid関数で年度を別にしています。 bins=30となっていますが、少し多すぎるようです。bins=10にしてみます。 2009…
今回は都道府県別のジニ係数データの分析をしようと思います。 政府統計の総合窓口、e-statからデータを取得しました。 www.e-stat.go.jp 年間収入のジニ係数、貯蓄現在高のジニ係数があって、二人以上の世帯、二人以上の世帯のうち勤労者世帯の二種類なので…
これならわかる コーポレートガバナンスの教科書 作者:松田 千恵子 発売日: 2015/08/11 メディア: Kindle版 コーポレートガバナンスとは、企業の舵取りを関係者間でいろいろと考えていこうよ、ということ。 そして、企業の舵取りというのは、普通は経営者に…
www.crosshyou.info の続きです。 今回はR言語でカイ2乗検定をしてみます。 まずは、クロス表を作成します。 こうして作成したm_tblはtibbleオブジェクトです。このうち、1列目はいらないので、削除します。 m_tbl[ , -1]で1列目を削除して、as.matrix関数…
www.crosshyou.info の続きです。 前回の分析で、母子家庭比率、父子家庭比率は地域のタイプ(都道府県、指定都市、中核都市)によって違いがありそうだとわかりました。 グラフにして確かめてみます。 まずは、地域タイプ別の箱ひげ図を作成してみました。 la…
www.crosshyou.info の続きです。 今回は、母子家庭の比率と父子家庭の比率に注目してみます。 母子家庭比率は、m_pop / t_pop で、 父子家庭比率は、f_pop / t_pop で計算できます。 母子家庭比率(m_ratio)のヒストグラムを見てみましょう。 母子家庭比率は…
今回は、児童扶養手当受給者データを分析しようと思います。 データは、政府統計の総合窓口、www.e-stat.go.jp から取得しました。 9月4日の新着ファイルで、厚生労働省から福祉行政報告例というファイルがありましたのでこれをクリックします。 クリックし…
www.crosshyou.info の続きです。 分析7ではマニュアル作業でデータフレームの構成を作り替えましたが、あれから少し調べてみると、gather関数というので簡単にできるらしいです。やってみます。 gather関数一つでできてしまううですね。 自分のためにgathe…
www.crosshyou.info の続きです。 前回、データフレームの構成を作り替えました。 これで、何をしたかったかというと、 こういうグラフを作りたかったのです。 スクリプトは、 library(RColorBrewer)でカラーパレットのパッケージを読み込みます。 df_new %>…