www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2020-02-01から1ヶ月間の記事一覧

都道府県別の趣味・娯楽の平均時間のデータ分析1 - R言語で基本統計量を算出する。男性のほうが趣味・娯楽の時間は多い。

今回は、都道府県別の趣味・娯楽時間のデータを分析してみたいと思います。 政府統計の総合口(e-stat)からデータを取得します。 www.s-stat.go.jp ですね。 度道府県別の人口増減率、1人当り県民所得、趣味・娯楽の平均時間(4種類ありました。男性/女性と有…

WHOの新型コロナウィルスのデータの分析1 - R言語で全体の死亡率や国別の死亡率を計算する。

今回は新型コロナウィルスの感染数と死者数のデータを使って死亡率を計算してみようと思います。 https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200227-sitrep-38-covid-19.pdf?sfvrsn=9f98940c_2 このレポートに掲載されてい…

建設総合統計のデータ分析5 - R言語で重回帰分析。民間の建設額を公共の建設額で重回帰分析。

www.crosshyou.info の続きです。 今回は、Minkan(民間)をKoKen(公共建築), KoHou(公共住宅), KoDob(公共土木)という3つの変数で回帰分析してみます。 まずは、plot関数で散布図を描いてみます。 正の相関がある感じです。 cor関数で相関係数も調べましょう…

建設総合統計のデータ分析4 - R言語のlm関数で回帰分析。

www.crosshyou.info の続きです。 今回は、Total(総計)をresponse variable, Minkan(民間)をexplanatory variableにして回帰分析をしてみます。 まずは、plot関数で散布図を描きます。 正の相関の散布図です。 lm関数で回帰分析をしてみます。 モデルのp値は…

建設総合統計のデータ分析3 - R言語で2変数のデータ分析の練習。Minkan(民間)とKokyo(公共)を例にして。var.test関数、t.test関数、wilcox.test関数、cor.test関数。

www.crosshyou.info の続きです。 今回は2変数のデータ分析の練習をしてみます。Minkan(民間)とKokyo(公共)の2変数を例にします。 まずは、boxplot関数で2つ変数の箱ひげ図を見てみます。 Minkan(民間)のほうがvariance, 平均値が大きそうです。 次に、va…

建設総合統計のデータ分析2 - R言語で1変数のデータ分析の練習。Total(総計)を例にして。

www.crosshyou.info の続きです。 今回は、R言語で1変数のデータ分析の練習をします。 参考図書は、Michael J. CrawleyのStatistics An Introduction Using Rです。 Statistics: An Introduction Using R 作者:Michael J. Crawley 出版社/メーカー: Wiley …

建設総合統計のデータ分析1 - R言語で基本統計量と変動係数(CV)を算出。民間土木が一番変動が少なく、民間非居住用が一番変動が大きい。

いつものように、e-stat 政府統計の総合窓口(www.e-stat.go.jp)を閲覧していたら、建設総合統計というデータが新着でありました。 今回はこのデータを分析してみましょう。 建設総合統計じゃ、国内の建設活動を出来高ベースで把握することを目的として加工統…

景気動向指数の長期系列データの分析6 - 年代も加えてもう一度R言語で回帰分析。lm関数、gam関数、rpart関数

www.crosshyou.info の続きです。 今回は前回と同じく回帰分析をしょうと思いますが、explanatory variableに年代も加えてみたいと思います。 それと、前回は全部の期間のデータを使って回帰分析をしましたが、今回は半分とトレーニング用、半分をテスト用に…

景気動向指数の長期系列データの分析5 - R言語を使って、DI一致指数をDI先行指数とDI遅行指数で回帰分析をする。lm関数、gam関数、rpart関数を使って。

www.crosshyou.info の続きです。 今回は、DI_C(DI一致指数)をDI_Lead(DI先行指数)とDI_Lag(DI遅行指数)で回帰分析してみようと思います。 lm関数を使ってみます。 DI_Lead:DI_Lagはp値が0.39と0.05よりも大きいので、削除してモデルをより単純化します。 an…

景気動向指数の長期系列データの分析4 - 各系列どうしの相関係数と散布図。CIとDICは相関関係が強い。

www.crosshyou.info の続きです。今回は各系列どうしの相関係数と散布図を描きます。 相関係数はcor関数、散布図はplot関数です。 まずはDIどうし、DI_Lead, DI_C, DI_Lagの相関と散布図です。 DI_LeadとDI_Cは0.63, DI_CとDI_Lagは0.45, DI_LeadとDI_Lagは0…

景気動向指数の長期系列データの分析3 - 1980年代、1990年代、2000年代で違いはあるか? DI先行系列だけ違いが無い。

www.crosshyou.info の続きです。 前回は月によって景気動向指数の値に違いがあるかどうかを調べました。結論は月によって景気動向指数に違いは無いということでした。 今回は、1980年代、1990年代、2000年代と10年ごとに年を区切って同じように景気動向指数…

景気動向指数の長期系列データの分析2 - 月によって景気動向指数に違いはあるのか?aov関数で分析。

www.crosshyou.info の続きです。 前回はデータをきれいにするところまででした。まずは、summary関数でデータの基本統計値を見ます。 Yearの最小値が1980で最大値が2008なので、このデータは1980年から2008年までのデータですね。 apply関数、sd関数、mean…

景気動向指数の長期系列データの分析1 - R言語でファイルを読み込む。ファクタ型を文字列に、文字列型を数値型にする。

政府統計の総合窓口、www.e-stat.go.jp のサイトを見たら、 景気動向指数が新着でありました。今回はこのデータを分析します。 景気動向指数は、生産、雇用など様々な経済活動での重要かつ景気に敏感に反応する指標の動きを統合することによって、景気の現状…

読書記録 - 「心と脳 - 認知科学入門」安西祐一郎 著 (岩波新書)

心と脳-認知科学入門 (岩波新書) 作者:安西 祐一郎 出版社/メーカー: 岩波書店 発売日: 2015/01/01 メディア: Kindle版 この本の「はじめに」に以下の文章がありました。 「現代における最大の課題の一つは心と脳と社会を総合的に理解することであり、認知…

都道府県別の新規求職申込件数の分析4 - R言語で年度別に集計して回帰分析。GDPが小さいほど、男性比率が高いほど申込件数は多い。

www.crosshyou.info の続きです。 今回は年度別の新規求職申込件数がどう推移してきているかを見てみます。 まずは、元のデータを確認します。head関数、summary関数でみてみましょう。 年別のMale, Female, GDP, Jobをまず集計します。tapply関数とsum関数…

都道府県別の新規求職申込件数の分析3 - R言語で重回帰分析。男女比の低い都道府県ほど、申込件数は多い。

www.crosshyou.info の続きです。 前回はpGDP(一人当りの県内総生産額)を説明変数にしてpJob(人口1000人当りの新規求職申込件数)を回帰分析しました。 今回は、説明変数にMFR(男性人口と女性人口の比)を加えて重回帰分析をしてみます。 まず、分析するデータ…