www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2022-02-01から1ヶ月間の記事一覧

KaggleのTitanicのデータの分析1- Pclassで1だと生存率は63%, 2だと47%, 3だと24%

Photo by K. Mitch Hodge on Unsplash 今回はKaggleのTitanicのデータを分析してみようと思います。生存・死亡を予測するのが目的ではなくて、単純にどんなデータなのか?というのを第一にしたいと思います。 まずは、Kaggleのウェブサイトからデータをダウ…

OECD Material productivity data analysis 6 - Using R to analyze panel data with plm package

Photo by JD Rincs on Unsplash www.crosshyou.info This post follows above post.In this post, I will do panel data regression analysis with R using plm package. First, le's see which year has many observations. 2010, 2011, 2012, 2013 and 201…

HistDataパッケージのDactyl

Photo by Charles Postiaux on Unsplash Dactylというの英語の詩の用語らしいです。 ダクティル (詩) - Wikipedia HistDataパッケージの中のDactylのデータセットは、Edgeworthさんという人がVirgl's Aneidの11巻目の本から始めの75行を調べて分類したデータ…

OECD Material Productivity data analysis 5 - Using R for testing AR(1) serial correlation.

Photo by Ken Cheung on Unsplash www.crosshyou.info This post follows above post. I add trend variable to static model. Althogh adding trend, GDP is still significant. So, I make three model, static model, finite distributed lag model and s…

OECD Material productivity data analysis 4 - Using R for Time-Series Data analysis, static model and finite distributed lag model

Photo by mostafa meraji on Unsplash www.crosshyou.info This post follow abovr post. In the previous post, I did cross section data analysis. In this post, I do time-series data analysis. First, let's check how many LOCATION have most data.…

読書記録 - 「ヘイト・スピーチとは何か」 師岡康子 著 岩波新書

ヘイト・スピーチとは何か (岩波新書) 作者:師岡 康子 岩波書店 Amazon この本が書かれたのは2013年11月なのでほぼ10年前です。 このときから日本がどのくらいヘイト・スピーチやマイノリティ、弱者に対する差別を少しでも無くすような施策をしてきたのだろ…

RのHistDataパッケージのCushnyPeebles

Photo by Alexander Schimmeck on Unsplash RのHistDataパッケージのCushnyPeeblesのデータは、Cushnyという方とPeeblesという方が睡眠に関する研究をしたときのデータのようです。 まずはデータを呼び出します。 ヘルプにないですが、このCushnyPeeblesのデ…

OECD Material productivity data analysis 3 - Using R for multiple linear regression. OLS(ordinary least squares) and WLS(weighted least squares)

Photo by Wolfgang Hasselmann on Unsplash www.crosshyou.info This post is following of above post. From the previous post, NONNRGMAT has correlated to r_capi: squared rooted per capita gdp. Let's do regression analysys using R. p-value for …

OECD Material productivity data analysis 2 - Using R ggplot2 for making some graphs.

Photo by Mateusz Klein on Unsplash www.crosshyou.info This post is following of the above post.Let's make some graphs to get big picuture of the data. Fisrstly, I make histograms for each variables. Let's start with NONNRGMAT TOTMAT before…

OECD Material productivity data analysis 1 - Using R to load CSV file data and reshape dataframe format with pivot_wider.

Photo by Ivana Cajina on Unsplash In this blog, I will analyze OECD Material productivity data. First, I downloaded data from the OECD webiste: Materials - Material productivity - OECD Data OECD (2022), Material productivity (indicator). d…

RのHistDataパッケージのCholera

Photo by Matthew Tan on Unsplash RのHistDataパッケージのCholeraのデータは、1948年から49年にかけての英国のコレラによる死亡者のデータです。 コレラの原因が何なのかを調べるデータです。 まずは、データを呼び出してstr()関数を使ってみます。 38の観…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析8 - Rのplmパッケージでパネルデータ分析をする。pooling法、first difference法、fixed effect法、random effect法の4つの方法を実行する。

Photo by Mike Swigunski on Unsplash www.crosshyou.info 今回はplmパッケージを使ってパネルデータ分析をしてみたいと思います。 まずはlibrary(plm)と入力してパッケージを読み込みます。 パネルデータ分析をするには、データフレームをパネルデータフレ…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析7 - 時系列の回帰分析の残差の系列相関の有無を調べる。

Photo by Boris Smokrovic on Unsplash www.crosshyou.info の続きです。 前回は、東京都の人口百万人当たりのあんま・マッサージ師の数を説明する時系列の回帰分析モデルを作成しました。どのモデルでも、はり・きゅう師の数が多いとあんま・マッサージ師の…

RのHistDataパッケージのChestSizes

Photo by Robert Thiemann on Unsplash RのHistDataパッケージの中のChestSizesです。 Queteletという人が調べたスコットランドの軍人のチェストサイズ、胸囲ですかね?のデータセットです。 このデータをつかって自然のデータが正規分布になっていることを…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析6 - Rのts()関数で時系列オブジェクトを作り、dynlm()関数で時系列データの回帰分析をする。

Photo by Michael on Unsplash www.crosshyou.info の続きです。 前回まではクロスセクションデータの分析でした。今回は時系列データの分析をしてみます。 まず、東京都だけのデータフレームを作成します。 filter()関数で東京都だけにしました。このデータ…