www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2022-01-01から1年間の記事一覧

OECD Nutrient balance data analysis 2 - Histogram using R

Photo by Leonardo Yip on Unsplash www.crosshyou.info This post is following of above post. In this post, I will do data visualization. Firstly, let's make a histograms. The previous post shows there are 4 kind of observations, NITOROGEN me…

OECD Nutrient balance data analysis 1 - load data into R

Photo by ross tek on Unsplash In this post, I will upload OECD Nutrient balance data in to R.From OECD web iste, I downloaded data csv file like below. Let's analyze this data in R! Firstly I load "tidyverse" package, this is the great pac…

都道府県別の教育費のデータの分析10 - Rのplmパッケージでパネルデータ分析

Photo by Colin Watts on Unsplash www.crosshyou.info の続きです。 今回はパネルデータ分析をします。 まず、plmパッケージを読み込みます。 このplmパッケージを使うとパネルデータ分析が簡単にできます。 まずは、通常のデータフレームをpdata.frame()関…

都道府県別の教育費のデータの分析9 - 時系列の回帰分析モデルで、Serial Correlationの有無をチェックする。

Photo by Alex Quezada on Unsplash www.crosshyou.info 前回は時系列データを回帰分析モデルで分析しました。 今回はそのモデルのSerial Correlationの有無をチェックします。 前回は、3つのモデルを作成してパラメータをOLSで推計しました。 OLSでの推計…

都道府県別の教育費のデータの分析8 - Rで時系列データの分析。回帰式のモデルにトレンド変数やラグ変数を追加する。

Photo by Redd on Unsplash www.crosshyou.info の続きです。 いままでは、都道府県別のデータを使って分析してきました。 今回は年別の平均値を使って、時系列データの分析をしてみます。 まずは、年別の平均値のデータフレームを作ります。 2001年から2014…

都道府県別の教育費のデータの分析7 - Heteroskedasticityのチェック

Photo by Annie Spratt on Unsplash www.crosshyou.info の続きです。 前回は、log(GdpPop) = beta_0 + beta_1 * log(EdPop) + beta_2 * log(Area) + u という重回帰分析のモデルを考えました。 回帰分析で重要な仮定の一つが「誤差項の分散が独立変数とは関…

読書記録 - 「世界史の考え方 シリーズ歴史総合を学ぶ①」 小川幸司/成田龍一 著 岩波新書

世界史の考え方 シリーズ歴史総合を学ぶ (岩波新書) 岩波書店 Amazon 私は高校生のとき、世界史や日本史は選択せずに地理を選択しました。というのも歴史は暗記するだけの科目というイメージがあったからです。 しかし、この本を読んで歴史を学ぶということ…

都道府県別の教育費のデータの分析6 - Rで重回帰分析 - 一人当り教育費が多いほど、一人当たり県内総生産額は少ない?

Photo by Tobias Stonjeck on Unsplash www.crosshyou.info の続きです。 今回は説明変数を複数にして、重回帰分析をしてみましょう。 まずは、log(Gdp) = log(Ed) + log(Pop) + log(Area) + u というモデルを分析してみます。 log(Pop)だけが有意な変数にな…

都道府県別の教育費のデータの分析5 - 回帰分析の係数の標準誤差を確認する。

Photo by Jeremy Bezanger on Unsplash www.crosshyou.info の続きです。 前回は、回帰分析のモデル、level -level, log - lelvel, level - log, log -log の4つもモデルを比較してみました。 今回は、OLSで推計した回帰式の係数の標準誤差を確認します。 s…

都道府県別の教育費のデータの分析4 - level - level, log -level, level - log, log - log モデルの回帰分析式

Photo by Ray Hennessy on Unsplash www.crosshyou.info の続きです。 前回は、単回帰分析で SST(total sum of squares) = SSE(explained sum of squares) + SSR(residual sum of squares)などの関係をみてみました。 今回は、Gdp, Edを対数変換して回帰分析…

都道府県別の教育費のデータの分析3 - Rで単回帰分析(Simple Regression Analysis)

Photo by Wolfgang Hasselmann on Unsplash www.crosshyou.info の続きです。 今回は単回帰分析(Sinple Regression Analysis)をRを使ってやってみます。 まず、前回作成したデータフレームから分析用のデータフレームを作ります。 複数年のデータでしたが、…

都道府県別の教育費のデータの分析2 - Rでデータをグラフにする。ggplot2パッケージのgeom_point(), geom_boxplot(), geom_line(), geom_histogram()

Photo by Antonio Sessa on Unsplash www.crosshyou.info の続きです。 前回はデータをRに読み込みました。 今回はそのデータをいろいろグラフにしてみます。 まずは、都道府県別のed: 教育費(都道府県財政と市町村財政の合計)です。 mutate()関数の中でreor…

都道府県別の教育費のデータの分析1 - Rにデータを読み込ませる。

Photo by Vadym Chumak on Unsplash 今回は、都道府県別の教育費のデータを分析しようと思います。 データは、政府統計の総合窓口(www.e-stat.go.jp)のウェブサイトから取得します。 まずは、47の都道府県を選択します。 教育費は都道府県財政の値と市町村財…

都道府県別の建設総合統計のデータの分析2 - Rの pivot_longer()関数で 横長型のデータフレームを縦長型に変換

Photo by Drew Bae on Unsplash www.crosshyou.info 前回はCSVファイルのデータを取り込みました。 今回は取り込んだデータをいろいろと調べてみようと思います。 はじめに前回作成したデータフレームがどんなものだったか確認します。 横にhokkaido, aomori…

都道府県別の建設総合統計のデータの分析1 - CSVのデータファイルをRに取り込む

Photo by Mikita Yo on Unsplash いつものように、政府統計の総合窓口(www.e-stat.go.jp)を閲覧すると、建設総合統計のデータベースが更新されているようでした。 建設総合統計は、国内の建設活動を出来高ベースで把握することを目的とした加工統計とのこと…

OECD Young self-employed data analysis 6 - panel data analysis using R - first differenced estimator using plm package

Photo by Daniel Olah on Unsplash www.crosshyou.info This post is following of above post. In this post, I will use First Differenced Estimator to estimate capi10K effect for men. The background model is below men = beta_0 + beta_1 * capi10…

OECD Young self-employed data analysis 5 - panel data analysis using R - basic pooling cross section regression

Photo by Colin Watts on Unsplash www.crosshyou.info This post is following of above post. In the above post, I made panel data set. Let's analyze with the panel data. Firstly, I male year dummy variable. y15 is 1 when TIME is 2015 and 0 wh…

読書記録 - 「日本の品種はすごい - うまい植物をめぐる物語」 竹下大学 著 中公新書

日本の品種はすごい-うまい植物をめぐる物語 (中公新書 (2572)) 作者:竹下 大学 中央公論新社 Amazon ジャガイモ、ナシ、リンゴ、ダイズ、カブ、ダイコン、ワサビについての品種のお話。 美味しい品種を作ろうと頑張る人たちに感謝です。

OECD Young self-employed data analysis 4 - data visualization again and combining GDP data.

Photo by Fatih Yürür on Unsplash www.crosshyou.info This post is following of above post. In the previous post, I made a new data frame, df_new, which has mem variable and women variable. Let's visualize those data. Firstly, men data by LO…

OECD Young self-employed data analysis 3 - Comparing men and women young data. men has higher ration than women.

Photo by RoonZ nl on Unsplash www.crosshyou.info This post is following of above post. In this post, let's compare men self-employed and women self-employed.Firstly, I make two vectors, "men" and "women" Let's see both summary statistics. …

OECD Young self-employed data analysis 2 - data visualization with ggplot2 package, geom_point(), geom_line(), geom_boxplot and geom_histogram() and geom_bar().

Photo by CHUTTERSNAP on Unsplash www.crosshyou.info This posit is following of above post.Let's see data on some graphs. I use ggplot2 package which is included in tidyverse package. gerom_point() function makes scatter plot. I see men has…

OECD Young self-employed data analysis 1 - Read CSV file using R

Photo by Slawek K on Unsplash In this post, I will analyze OECD Young self-employed data. This is the sare of self-employed aged 20-29 among all employed worksers aged 20-29 in this group. The CSV file which I download from OECD web site i…

読書記録 - 「SDGs --- 危機の時代の羅針盤」 南博 & 稲葉雅紀 著 岩波新書

SDGs――危機の時代の羅針盤 (岩波新書) 作者:南 博,稲場 雅紀 岩波書店 Amazon この本を読んで思ったのは、 SDGs は現在の人間世界が直面している危機のカタログみたいなものだ、ということです。 17のゴールとして2030年までに達成しなければならない目標が…

全国統一の小売物価統計のデータ分析6 - Serial Correlation の有無を調べる。AR(1)の系列相関テストと、ダービン・ワトソン検定

Photo by Al Pangestu on Unsplash www.crosshyou.info 前回はdynlmパッケージのdynlm()関数を使って、時系列データの回帰分析をしました。 時系列データの回帰分析では、系列相関(Serial Correlation)があると上手く分析できませんので、今回は前回の回帰分…

全国統一の小売物価統計のデータ分析5 - dynlmパッケージのdynlm()関数で時系列データの回帰分析

Photo by Allyson Beaucourt on Unsplash www.crosshyou.info の続きです。 前回の分析で、年や月は統計的に有意な影響を価格には及ぼしていないことがわかりました。 今回は一番高い価格の外車のデータに絞って、時系列分析をしてみます。 まず、外車だけの…

読書記録- 「日本の国会議員-政治改革後の限界と可能性」 濱本真輔 著 中公新書

日本の国会議員-政治改革後の限界と可能性 (中公新書, 2691) 作者:濱本 真輔 中央公論新社 Amazon 日本の国会議員の様子を各種サーベイや公表資料からまとめたもの。 国会議員が戦後から全体としてどのように変化してきているのかを、人材、選挙、政策形成、…

全国統一の小売物価統計のデータ分析4- carパッケージのlinearHypothesis()関数で回帰分析のF検定をする。年も月も有意でない。

Photo by Dan Freeman on Unsplash www.crosshyou.info の続きです。 前回の分析で月別や年別に物価に違いがあることがわかりました。 今回は統計的にその違いが有意なのかどうかを確認します。 lm()関数で回帰分析のモデルを作りました。 carパッケージの読…

全国統一の小売物価統計のデータ分析3 - R言語のplot()関数とbarplot()関数で基本的なグラフを描く。5,6,7月が物価が安い月だった。

Photo by Simon Maage on Unsplash www.crosshyou.info の続きです。 このように、name_codeに対応して、sinryou_kenpoのようにそれを表す名前を付与したCSVファイルを作成しました。 これをRに読み込みます。 このデータフレームを前回作成してあるdata_ful…

全国統一の小売物価統計のデータ分析2 - 読み込んだデータを分析しやすいように整える。

Photo by Leo Mendes on Unsplash www.crosshyou.info の続きです。 前回はCSVファイルのデータをRに読み込ませました。 今回はデータを分析しやすいように整えます。 やるべきことは3つありました。 1。NAの行を削除する 2。title_code, title, name, ti…

全国統一の小売物価統計のデータ分析1 - R言語にCSVファイルを読み込む。

Photo by Jeremy Thomas on Unsplash 政府統計の総合窓口、e-statのサイトを見ると、小売物価統計のデータベースが更新されたようです。 今回はこのデータをダウンロードして分析してみます。 小売物価統計調査(動向編)というのが更新されたようです。 月次[…