crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

読書記録 - 「地政学入門 改版 - 外交戦略の政治学」 曽村 保信 著 中公新書

地政学入門 改版 - 外交戦略の政治学 (中公新書) 作者:曽村 保信 中央公論新社 Amazon 1984年が初版で、2017年が改版の初版です。 序章のタイトルが、「地球儀を片手に」ということで、地球儀を手元に置いて読んだらもっとよく理解できるだろうなと感じまし…

都道府県別の保護統計調査のデータ分析5 - R言語のgeom_col()でバーグラフ、geom_line()でライングラフを描く。

UnsplashのTom Podmoreが撮影した写真 www.crosshyou.info の続きです。 今回は2021年のデータを使い、前回作成した各保護観察処分の割合を見てみます。 まずは、1号観察の比率ランキングをみてみます。 那覇は6割、松江は2割ぐらいと、都道府県によって大…

都道府県別の保護統計調査のデータの分析4 - R言語のpivot_wider()でデータフレームをワイド型に変換して、散布図マトリックスを描く。

UnsplashのRoméo A.が撮影した写真 www.crosshyou.info の続きです。 今回は、データフレームを少し変形します。 このように、保護観察処分の1号、2号、3号、4号が一つの type の列におさまっているのを、 このように、1号は1号の列、2号は2号の列と…

都道府県別の保護統計調査のデータの分析3 - R言語のggplot()+geom_histogram()でヒストグラムを描く

UnsplashのEd Robertsonが撮影した写真 www.crosshyou.info の続きです。 前回と同様に、でも今度は2つの変数の組み合わせ別に基本統計量を算出します。 まずは、typeとlocationです。 typeとyearの基本統計量のデータセットを作ります。 三つ目は、location…

都道府県別の保護統計調査のデータの分析2 - Rのgroup_by(), summarize()などを使用して基本統計量をタイプ別、場所別、年別に算出する。

UnsplashのMarkus Spiskeが撮影した写真 www.crosshyou.info 上のブログ記事の続きです。 前回は、保護観察統計のデータをRに読み込ませるところまでやりました。 今回は、もう少し分析っぽいことをやりましょう。 まず、データの見た目を整えます。 typeの…

読書記録 - 「迫りくる核リスク <核抑止> を解体する」 吉田 文彦 著 岩波新書

迫りくる核リスク 〈核抑止〉を解体する (岩波新書 新赤版 1946) 作者:吉田 文彦 岩波書店 Amazon 核戦争がいままで起こらなかったのは、米国とソ連(ロシア)の核抑止戦略が機能していたというよりは、幸運によるところが大きかった。 核兵器を地球上から廃絶…

都道府県別の保護統計調査のデータの分析1 - Rでcsvファイルのデータを読み込み、tidyなデータフレームに修正する。

UnsplashのVishu Jooが撮影した写真 今回は、都道府県別の保護統計調査のデータを分析してみようと思います。 政府統計の総合窓口、e-statのウェブサイトからデータ取得します。 観察所別 開始人員累年比較 というデータをダウンロードしてみます。 このよう…

OECD Nuclear power plants data analysis 5 - Hypothesis test for One proportion using R infer package.

UnsplashのCraig Mannersが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, I will do hypothesis test for one proportion. For Japan nuclear power plants proportion. In the previous post, I found Japan n…

OECD Nuclear power plants data analysis 4 - Getting confidence interval for one proportion using R infer package

UnsplashのMaarten van den Heuvelが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, I will get confidence interval for one proportion. In this case, number of nuclear power plants in Japan / number of …

OECD Nuclear power plants data analysis 3 - Hypothesis testing using R with infer package

UnsplashのYan Agritが撮影した写真 www.crosshyou.info This post is following of the above post. In this post I do hypothesis testing using R with infer package. I refere to B Inference Examples | Statistical Inference via Data Science (mode…

OECD Nuclear power plants data analysis 2 - Getting Confidence Interval using R with infer package

UnsplashのEean Chenが撮影した写真 www.crosshyou.info This post is following of the above post.I will calculate confidence interval in this post. There are two ways to calclulate confidence interval, one is bootstrap method and the other is…

OECD Nuclear power plants data analysis 1 - Loading CSV data with R - USA has the most nuclear power plants.

UnsplashのLukáš Lehotskýが撮影した写真 In this post, I will playaround with OECD Nuclear power plants data with R. OECD Nuclear power plants data is defined as the number of nuclear units in operation as of 1 January 2019. It is measured a…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析6 - R言語でクラシフィケーション、パラメータをチューニングしてさらに正解率を高める。

UnsplashのJonatan Pieが撮影した写真 www.crosshyou.info の続きです。 前回はR言語のcaretパッケージで、generalized liner model regressionとk-nearest neighborsの2つの方法でクラシフィケーションをしました。 k-nnはチューニングのパラメータがありま…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析5 - R言語のcaretパッケージで簡単クラシフィケーション

Unsplashのmicheile dot comが撮影した写真 www.crosshyou.info の続きです。今回はR言語でクラシフィケーション分析をしてみようと思います。 まず、caretパッケージの読み込みをします。 2019年と2020年のデータをトレーニング用のデータ、2021年のデータ…

読書記録 - 「地球外生命 アストロバイオロジーで探る生命の起源と未来」 小林憲正 著 中公新書

地球外生命 アストロバイオロジーで探る生命の起源と未来 (中公新書) 作者:小林憲正 中央公論新社 Amazon 読みながらワクワクしました。 火星や金星、木星の衛星のエウロパ、土星の衛星のタイタンやエンケラドゥスなどにもしかしたら生命が存在するかもしれ…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析4 - R言語のinferパッケージを使い、平均値の信頼区間を視覚化する。

UnsplashのSimon Bergerが撮影した写真 www.crosshyou.info の続きです。 今回は、R言語のinferパッケージを使って、opm(営業利益率)の平均値の信頼区間を算出してみます。 まずは、group_by()とsummarize()とmean()を使って、製造業のopm、卸売小売業のopm…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析3 - R言語のarrange()関数で都道府県別ランキング

UnsplashのPete Wongが撮影した写真 www.crosshyou.info の続きです。前回はデータをグラフにしてみました。 今回は都道府県別のランキングを見てみましょう。 まずは、製造業のrevenueランキングです。filter()関数で製造業にしてから、arrange()関数とdesc…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析2 - R言語のggplot2パッケージで5種類のよく使うグラフを描く

UnsplashのAlex Basovが撮影した写真 www.crosshyou.info の続きです。 今回はデータをグラフにして、どんなデータなのかを把握してみたいと思います。 はじめに変数がどんなデータがあるかを確認したいと思います。 summary()関数で一覧してみます。 year_c…

都道府県別の個人企業経済調査(製造業と卸売業、小売業)のデータ分析1 - R言語にデータを取り込む

UnsplashのSingle.Earthが撮影した写真 今回は都道府県別の個人企業経済調査のデータの分析をしてみたいと思います。 (振り返ってみると、2021年3月にもこのデータを分析していましたが、自分の中ではすっかり忘れていました。) 政府統計の総合窓口、www.e-s…

OECD Social spending data analysis 6 - Linear regression using R

UnsplashのWaranont (Joe)が撮影した写真 www.crosshyou.info This post is following of the above post. In this post I will do linear regression anaysis using R. Firstly, I will start with one numerical explanatory variable. Above code shows t…

OECD social spending data analysis 5 - Bootstrapping with R infer package

UnsplashのSonika Agarwalが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, I will do bootstrapping with R infer package. Suppoese df2$priv_pc_gdp is population. So true mean of priv_pc_gdp is The true…

読書記録 - 「スピノザ - 読む人の肖像」 國分功一郎 著 岩波新書

スピノザ――読む人の肖像 (岩波新書 新赤版) 作者:國分 功一郎 岩波書店 Amazon スピノザという哲学者が昔、オランダに住んでいました。 彼は、聖書やデカルトの方法序説などをとてもよく読んで、彼独自の新しい哲学を作ったようです。 私には難しくて、2割も…

OECD Social spending data analysis 4 - Calculating Confidence Interval using R

UnsplashのArda Demirkaynakが撮影した写真 www.crosshyou.info This post is following of above post. In the previous post, I made some visualizations with R ggplot2 package. In this post. In this post I will calculate confidence intervals. Fi…

OECD Social spending data analysis 3 - Data Visualization with 5 Named Graphs (5NG) using R

UnsplashのAlicia Steelsが撮影した写真 www.crosshyou.info This post is following of above post.In the previous post, I made a dataframe for data analysis, named 'df2'.Now, let's start data analysis with data visualization.I will make 5 Name…

OECD Social spending data analysis 2 - Using filter(), select(), inner_join(), rename() function with R to make a dataframe to analyze.

UnsplashのMilos Prelevicが撮影した写真 www.crosshyou.info This post is following of the above post. In the previous post, I load OECD Social spending data into R. I also load country ISO code and continent name data like below CSV file. I …

OECD Social spending data analysis 1 - Load CSV file data using R, read_csv() function.

UnsplashのAlexander Schimmeckが撮影した写真 In this post I will analyze OECD Social spending data using R. OECD (2022), Social spending (indicator). doi: 10.1787/7497563b-en (Accessed on 26 November 2022) This indicator is measured as a pe…

都道府県別の被服及び履物費のデータの分析6 - R言語のplmパッケージでパネルデータ分析。First Difference, Fixed Effect, Random Effect Estimator.

UnsplashのZoltan Tasiが撮影した写真 www.crosshyou.info の続きです。 前回はR言語のplmパッケージを使ってパネルデータフレームを作成し、model = "pooling" にして普通のクロスセクションで回帰分析をしました 今回は、First Differenced Estimator, Fix…

都道府県別の被服及び履物費のデータの分析5 - R言語でパネルデータ分析。plmパッケージのplm()関数を使う

UnsplashのAndrey Andreyevが撮影した写真 www.crosshyou.info の続きです。 今回は、R言語でパネルデータの分析をします。 Using R for Introductory Econometrics 作者:Heiss, Florian Independently Published Amazon こちらの本を参考にしてやってみます…

都道府県別の被服及び履物費のデータの分析4 - R言語で回帰分析。カテゴリーデータを説明変数に加える。重回帰分析。

UnsplashのGwen Weustinkが撮影した写真 www.crosshyou.info の続きです。 前回はwear_shoeを被説明変数、wariaiを説明変数にして単回帰分析をしました。 今回はもう一つ説明変数を加えてみます。カテゴリーデータを加えてみましょう。 まず、カテゴリーデー…

都道府県別の被服及び履物費のデータの分析3 - R言語で回帰分析。まずは単回帰分析。15~64歳の人口割合を説明変数にする。

UnsplashのBoris Smokrovicが撮影した写真 www.crosshyou.info の続きです。 今回はR言語で回帰分析をしてみます。 被説明変数は、wear_shoe: 被服及び履物費です。回帰分析をはじめる前にwear_shoeとその他の説明変数の候補との相関関係を確認しておきまし…