crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

OECD Non-Financial Corporation Debt to Surplus Ratio Analysis 5 - arranging data frame and make a bar chart using R.

UnsplashのPierre Lemosが撮影した写真 www.crosshyou.info Thsi post is following of the above post. In this post I will arrange data frame with arrange() function of dplyr packkage. Let's make a graph with ggplot2 packages. LUX has the highe…

OECD Non-Financial Corporations Debt to Surplus Ratio Analysis 4 - t-test, Wilcoxon rank sum test and correlation test using R

Unsplashのmartin bennieが撮影した写真 www.crosshyou.info This post is following of above post. Let's calculate difference between Y2016 and Y2015 Let's see a histogram of d2016 Then, let's calculate difference between Y2017 and Y2016 Let's…

OECD Non-Financial Corporations Debt to Surplus Ratio Analysis 3 - Calculating Confidence Interval in R, Parametric and Monte Carlo.

UnsplashのHeather Wildeが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, I will show some statistics of our data. Before investigation, I make data frame to wide format with pivot_wider() function. W…

OECD Non-Financial Corporations Debt to Surplus Ratio Analysis 2 - making various type plots with ggplot() + geom_~~~ using R.

UnsplashのJ Cruikshankが撮影した写真 www.crosshyou.info This post is following of the above post. In the previous post, I load CSV file data into R. Then, let's make some basic graphs using ggplot2 package. Scatter plot ggplot() + geom_poi…

OECD Non-Financial Corporations Debt to Surplus Ratio Analysis 1 - Load CSV file data using R

UnsplashのJeremy Thomasが撮影した写真 In this post, I will use R for analysis about OECD Non-Financial Corporations Debt to Surplus Ratio. This ratio is debt outstanding / annual flow if gross operating surplus. So, the higher the ratio, t…

都道府県別の定期健康診断結果報告のデータ分析9 - R言語で非階層クラスタリング

UnsplashのWexor Tmgが撮影した写真 www.crosshyou.info の続きです。前回はR言語で階層クラスタリングをしました。今回は非階層クラスタリングをしてみて、前回の結果を比較してみます。 k-means法というクラスタリング手法で、kmeans()関数で実行可能です…

都道府県別の定期健康診断結果報告のデータ分析8 - R言語で階層クラスタリング

UnsplashのSora Saganoが撮影した写真 www.crosshyou.info 前回までは回帰分析をしていましたが、 今回はR言語でクラスタリングをしてみようと思います。 まず、クラスタリング用のデータフレームとして、aggregate()関数とmean()関数を使って3年間の平均の…

都道府県別の定期健康診断結果報告のデータ分析7 - R言語でパネルデータを回帰分析する。

UnsplashのLeopold Stengerが撮影した写真 www.crosshyou.info 前回は年と都道府県も説明変数に加えてtworatioを重回帰分析してみました。その結果、l_num: 健康診断を実施した事業場数の対数変換値はtworatioを説明する有意な変数ではないことがわかりまし…

都道府県別の定期健康診断結果報告のデータ分析6 - R言語で回帰モデルの不均一分散に適応した標準誤差やF検定をする。

UnsplashのGanapathy Kumarが撮影した写真 www.crosshyou.info の続きです。 前回の重回帰モデルに年と都道府県を説明変数に加えて、l_numの係数がどうなるかを見てみます。 まず、yearをas.factor()関数でファクター型に変換した変数をつくります。 yfがフ…

都道府県別の定期健康診断結果報告のデータ分析5 - R言語で回帰モデルの均一分散を調べたり、複数の回帰モデルの表を作成する。

UnsplashのYoksel Zokが撮影した写真 www.crosshyou.info の続きです。 前回は tworatio: 2回以上実施した事業場数の割合をnum: 検査を実施した事業所の数で回帰分析してみました。その結果、事業所の数が大きいほど、割合は低下している傾向があることがわ…

読書記録 - 「未踏の蒼穹」 ジェイムズ・P・ホーガン

未踏の蒼穹 (創元SF文庫) 作者:ジェイムズ・P・ホーガン 東京創元社 Amazon 大学生か高校生の頃に同じ作者の「星を継ぐもの」を読んでほんとうにSFって面白いと感じました。同じ作者の同じような話です。地球人はもう絶滅してしまっていて、金星人たちが主…

読書記録 - 「理論とケースで学ぶ 企業倫理入門」 高浦康有・藤野真也 編

理論とケースで学ぶ 企業倫理入門 白桃書房 Amazon 企業倫理学は、誤解を恐れずに言えば、グッド・ビジネスとは何かを探求する学問である。そして、「グッド」の基準を定めることの難しさと「ビジネス」という言葉の多様性がこの学問の面白いところだと思っ…

都道府県別の定期健康診断結果報告のデータ分析4- R言語で棒グラフを描いたり、単純線形回帰分析をしたりする。

UnsplashのCristina Anne Costelloが撮影した写真 www.crosshyou.info 今回は、上のブログの続きです。 前回は、散布図や箱ひげ図を描きました。今回は、barplot()関数を使って棒グラフを描いてみます。 まずは、ritsu: 所見のあった人数の割合を都道府県ご…

都道府県別の定期健康診断結果報告のデータ分析3 - R言語で散布図や箱ひげ図を描いたり、ANOVA分析をしたりする。

UnsplashのJean Girouxが撮影した写真 www.crosshyou.info 前回はR言語でヒストグラムを描きました。今回は散布図を描いでみます。 plot()関数で、データフレームの散布図にしたい変数を指定すると、上の画面のような散布図のマトリックスが描かれます。 rit…

都道府県別の定期健康診断結果報告のデータ分析2 - R言語でヒストグラムを描く

Photo by Thijs Boom on Unsplash www.crosshyou.info この記事は上の記事の続きです。 今回は、R言語に読み込んだデータをグラフにしてみます。tidyverseパッケージを使わずに、通常のグラフィック関数でやってみます。 まずは、それぞれの変数の分布状況を…

都道府県別の定期健康診断結果報告のデータ分析1 - R言語にデータを取り込む

Photo by Dana Luig on Unsplash 今回は、都道府県別の定期健康診断結果報告のデータを調べてみます。 政府統計の総合窓口(www.e-stat.go.jp)のウェブサイトからデータをダウンロードします。 定期健康診断結果報告は、労働安全衛生法に基づく定期健康診断結…

OECD Nutrient balance data analysis 8 - F-Test and Heteroskedasticity-Robust Inference in R

Photo by S. Tsuchiya on Unsplash www.crosshyou.info This post is following above post. In the previous post, I did multiple regression, s_ni_kg ~ s_po_kg + s_ni_to. Let's add 'time' variables. All time variables are not statistically signi…

OECD Nutrient balance data analysis 7 - Simple Regression and Multiple Regression using R

Photo by Harry Gillen on Unsplash www.crosshyou.info This post is following of the above post. In the previous post, I made scaled variables in df4, let's see correlation matrix of those variables. The most highly correlated variable pair …

OECD Nutrient balance data analysis 6 - making a panel data using R

Photo by Philip Myrtorp on Unsplash www.crosshyou.info This post is following of above post. Since I made several objects, let me confirm what objects there is. ls() function shows current object list. So far, I have df_raw, df1, df2 and d…

OECD Nutrient balance data analysis 5 - Hierarchical Clustering using R

Photo by Erda Estremera on Unsplash www.crosshyou.info This post is following of above post. Let's make two scatter plots and display them in a panel. Firstly, I load gridExtra package. Then, I make two objects, each object is for a scatte…

OECD Nutrient balance data analysis 4 - PCA(Principal Component Analysis) using R

Photo by Ash from Modern Afflatus on Unsplash www.crosshyou.info This post is following of above post. In the above post, I made a dataframe which has basic statistics data for each locations. Let's look into it further, Firstly, let's see…

OECD Nutrient balance data analysis 3 - Line charts using R

Photo by Stephen Leonardi on Unsplash www.crosshyou.info This post is following of above post. I will make line charts using R ggplot2 package. Let's start with ni_kg(NITROGEN measured by KG_HA) Some locations have declining trend, some ha…

OECD Nutrient balance data analysis 2 - Histogram using R

Photo by Leonardo Yip on Unsplash www.crosshyou.info This post is following of above post. In this post, I will do data visualization. Firstly, let's make a histograms. The previous post shows there are 4 kind of observations, NITOROGEN me…

OECD Nutrient balance data analysis 1 - load data into R

Photo by ross tek on Unsplash In this post, I will upload OECD Nutrient balance data in to R.From OECD web iste, I downloaded data csv file like below. Let's analyze this data in R! Firstly I load "tidyverse" package, this is the great pac…

都道府県別の教育費のデータの分析10 - Rのplmパッケージでパネルデータ分析

Photo by Colin Watts on Unsplash www.crosshyou.info の続きです。 今回はパネルデータ分析をします。 まず、plmパッケージを読み込みます。 このplmパッケージを使うとパネルデータ分析が簡単にできます。 まずは、通常のデータフレームをpdata.frame()関…

都道府県別の教育費のデータの分析9 - 時系列の回帰分析モデルで、Serial Correlationの有無をチェックする。

Photo by Alex Quezada on Unsplash www.crosshyou.info 前回は時系列データを回帰分析モデルで分析しました。 今回はそのモデルのSerial Correlationの有無をチェックします。 前回は、3つのモデルを作成してパラメータをOLSで推計しました。 OLSでの推計…

都道府県別の教育費のデータの分析8 - Rで時系列データの分析。回帰式のモデルにトレンド変数やラグ変数を追加する。

Photo by Redd on Unsplash www.crosshyou.info の続きです。 いままでは、都道府県別のデータを使って分析してきました。 今回は年別の平均値を使って、時系列データの分析をしてみます。 まずは、年別の平均値のデータフレームを作ります。 2001年から2014…

都道府県別の教育費のデータの分析7 - Heteroskedasticityのチェック

Photo by Annie Spratt on Unsplash www.crosshyou.info の続きです。 前回は、log(GdpPop) = beta_0 + beta_1 * log(EdPop) + beta_2 * log(Area) + u という重回帰分析のモデルを考えました。 回帰分析で重要な仮定の一つが「誤差項の分散が独立変数とは関…

読書記録 - 「世界史の考え方 シリーズ歴史総合を学ぶ①」 小川幸司/成田龍一 著 岩波新書

世界史の考え方 シリーズ歴史総合を学ぶ (岩波新書) 岩波書店 Amazon 私は高校生のとき、世界史や日本史は選択せずに地理を選択しました。というのも歴史は暗記するだけの科目というイメージがあったからです。 しかし、この本を読んで歴史を学ぶということ…

都道府県別の教育費のデータの分析6 - Rで重回帰分析 - 一人当り教育費が多いほど、一人当たり県内総生産額は少ない?

Photo by Tobias Stonjeck on Unsplash www.crosshyou.info の続きです。 今回は説明変数を複数にして、重回帰分析をしてみましょう。 まずは、log(Gdp) = log(Ed) + log(Pop) + log(Area) + u というモデルを分析してみます。 log(Pop)だけが有意な変数にな…