# OECD Gross pension replacement rates data analysis 5 - t-test with simulation based using "infer" package of R. There is no significant difference between 2014 and 2020.

Generated by Bing Image Creator www.crosshyou.info This post is following of the above post. In the above post, I visualize replacement rates of 2014 and 2020. And there seems no signficant difference. In this post, let's confirm that usin…

# OECD Gross pension replacement rates data analysis 4 - Visualization Histogram and Boxplot using R. There is not much difference between 2014 and 2020.

Generated by Bing Image Creatorwww.crosshyou.info This post is following of the above post. In this post I will analysis difference between 2014 and 2020. First, I make a data frame to calculate difference between 2014 and 2020. filter() f…

# OECD Gross pension replacement rates data analysis 3 - Is there statistically significant difference between MEN and WOMEN? Using R infer package workflow.

UnsplashのIvan Jevticが撮影した写真 www.crosshyou.info This post is followong of the above post. In this post I will check the first question, 1 - MEN and WOMEN have different replacement rate? I use 'infer' package workflow, it is not the…

# OECD Gross pension replacement rates data analysis 2 - making data frame for analysis using select(), rename(), mutate() function and making a histogram with ggplot() + geom?histogram() function with R

UnsplashのAyesha Firdausが撮影した写真 www.crosshyou.info This post is following of the above post. In the previous post, I load CSV file data into R with read_csv() function. In this post I make a data frame for analysis use. First, I sel…

# OECD Gross pension replacement rates data analysis 1 - read_csv() function to load CSV file data into R and skim() function to check each variables.

UnsplashのQingbao Mengが撮影した写真 In this post, I will analyze OECD Gross pension replacement rates data. According to the above definions, the higher replacement rates implies richer retirement life wit pension income.First, I download…

# 都道府県別の医療施設調査の病院数のデータ分析７ - Rで階層的クラスタリングをしてみる。

UnsplashのJan Cantyが撮影した写真 www.crosshyou.info 今回は、Rで階層的クラスタリングをしてみます。 R言語でクラスタリングしてみた - Qiita を参考にしています。 まずは、クラスリング用のマトリックスオブジェクトを作成します。 chg: 病院数の変化…

# 都道府県別の医療施設調査の病院数のデータ分析６ - 線形回帰分析の係数の信頼区間は、理論ベースよりもシミュレーションベースのほうがいいよ。

UnsplashのKwang Mathurosemontriが撮影した写真 www.crosshyou.info 今回は、per_chg: 人口10万人当たりの病院数の変化をper1999: 1999年の人口10万人当たりの病院数と、y1999: 1999年の病院数で回帰分析をしてみましょう。 まずは、lm()関数で回帰分析して…

# 都道府県別の医療施設調査の病院数のデータ分析５ - 人口10万人当たりの病院数の変化を見る。福井県が大幅に減少。

UnsplashのAhmed Zayanが撮影した写真 www.crosshyou.info の続きです。 今回は1999年の人口10万人当たりの病院数と2019年の人口10万人当たりの病院数を比べてみましょう。 1999年の人口10万人当たりの病院数を求めるためには、1999年の都道府県別の人口のデ…

# 都道府県別の医療施設調査の病院数のデータ分析４ - 病院数と人口10万人当たりの病院数の回帰分析をRのlm()関数で実行する。

UnsplashのFlorentina Tilvicが撮影した写真 www.crosshyou.info 今回は、病院数と人口10万人当たりの病院数の関係性をみてみましょう。 まず、散布図を描きます。 ggplot() + geom_point()関数で散布図を作成しました。 あんまり関係なさそうです。 今回は …

# 都道府県別の医療施設調査の病院数のデータ分析３ - Rのinferパッケージを利用して、相関係数の検定を行う。

UnsplashのBob Brewerが撮影した写真 www.crosshyou.info 前回は、cor.test()関数を使って病院の数の変化幅と、開始年の病院の数の相関を検定しました。結果は、相関係数は-0.725と負の強い相関があり、95%信頼区間は-0.838 ~ -0.553でした。 今回は、infer…