www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2022-05-01から1ヶ月間の記事一覧

全国統一の小売物価統計のデータ分析6 - Serial Correlation の有無を調べる。AR(1)の系列相関テストと、ダービン・ワトソン検定

Photo by Al Pangestu on Unsplash www.crosshyou.info 前回はdynlmパッケージのdynlm()関数を使って、時系列データの回帰分析をしました。 時系列データの回帰分析では、系列相関(Serial Correlation)があると上手く分析できませんので、今回は前回の回帰分…

全国統一の小売物価統計のデータ分析5 - dynlmパッケージのdynlm()関数で時系列データの回帰分析

Photo by Allyson Beaucourt on Unsplash www.crosshyou.info の続きです。 前回の分析で、年や月は統計的に有意な影響を価格には及ぼしていないことがわかりました。 今回は一番高い価格の外車のデータに絞って、時系列分析をしてみます。 まず、外車だけの…

読書記録- 「日本の国会議員-政治改革後の限界と可能性」 濱本真輔 著 中公新書

日本の国会議員-政治改革後の限界と可能性 (中公新書, 2691) 作者:濱本 真輔 中央公論新社 Amazon 日本の国会議員の様子を各種サーベイや公表資料からまとめたもの。 国会議員が戦後から全体としてどのように変化してきているのかを、人材、選挙、政策形成、…

全国統一の小売物価統計のデータ分析4- carパッケージのlinearHypothesis()関数で回帰分析のF検定をする。年も月も有意でない。

Photo by Dan Freeman on Unsplash www.crosshyou.info の続きです。 前回の分析で月別や年別に物価に違いがあることがわかりました。 今回は統計的にその違いが有意なのかどうかを確認します。 lm()関数で回帰分析のモデルを作りました。 carパッケージの読…

全国統一の小売物価統計のデータ分析3 - R言語のplot()関数とbarplot()関数で基本的なグラフを描く。5,6,7月が物価が安い月だった。

Photo by Simon Maage on Unsplash www.crosshyou.info の続きです。 このように、name_codeに対応して、sinryou_kenpoのようにそれを表す名前を付与したCSVファイルを作成しました。 これをRに読み込みます。 このデータフレームを前回作成してあるdata_ful…

全国統一の小売物価統計のデータ分析2 - 読み込んだデータを分析しやすいように整える。

Photo by Leo Mendes on Unsplash www.crosshyou.info の続きです。 前回はCSVファイルのデータをRに読み込ませました。 今回はデータを分析しやすいように整えます。 やるべきことは3つありました。 1。NAの行を削除する 2。title_code, title, name, ti…

全国統一の小売物価統計のデータ分析1 - R言語にCSVファイルを読み込む。

Photo by Jeremy Thomas on Unsplash 政府統計の総合窓口、e-statのサイトを見ると、小売物価統計のデータベースが更新されたようです。 今回はこのデータをダウンロードして分析してみます。 小売物価統計調査(動向編)というのが更新されたようです。 月次[…

HistDataパッケージのLangren

Photo by Gaetano Cessati on Unsplash HistDataパッケージのLangrenは17世紀の数学者・天文学者のMichael Florent van Langrenのデータです。この当時、天文学上の大きな問題の一つであった経度の正確な測定について仕事をした人です。 データを呼び込みま…

OECD Discriminatory family code data analysis 8 - Comparing some classification methods.

Photo by Marek Piwnicki on Unsplash www.crosshyou.info This post is following of above post. In this post, I will do some classification methods. Firstly, I make binary variable. I made a binary variable named high, that shows 1 when lpc_g…

OECD Discriminatory family code data analysis 7 - Adding Unemployment data to linear regression and using stargazer() function to compare regression models.

Photo by henry perks on Unsplash www.crosshyou.info This post is following of above post. I load Unenployment rate data. I get this data from OECD we site. Then, I filter only year == 2019. Next, I will merge df4 data frame and unem_2019 d…

OECD Discriminatory family code data analysis 6 - Adding Inflation data to linear regression, still "atwm" and "em" are significant.

Photo by Alexander Schimmeck on Unsplash www.crosshyou.info This post is following of above post.In this post I will add inflation data into previous post's linear regression model.Firstly, I will load inflation data. I got the inflation d…

HistDataパッケージのJevons

Photo by Setu Chhaya on Unsplash HistDataパッケージのJevonsというデータは、1871年のNatureという雑誌に掲載されたW. Stanley Jevonsの実験のデータです。 黒いビーズを複数個、パッと見せて、何個だったか答えさせるという実験です。人間が一度に認識で…

OECD Discriminatory family code data analysis 5 - Linear regression using R. Attitudes Towards Working Mother, Early Marriage and Per Capita GDP

Photo by Bjorn Pierre on Unsplash www.crosshyou.info This post is following of above post.In this post, I will do linear regression analysis with R. First, I make a data frame which have "atwm": Attitudes Towards Working Mothers only. Seco…