www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2020-01-01から1ヶ月間の記事一覧

都道府県別の新規求職申込件数の分析2 - R言語で回帰分析。外れ値を含んだデータと含んでないデータで比較。

www.crosshyou.info の続きです。 今回はR言語で回帰分析をしてみます。 まず、2015年度だけのデータフレームを作成してdf15と名前をつけます。 このdf15のpJob(人口1000人当りの新規求職申込件数)とpGDP(一人当りの県内総生産額(万円))を回帰分析します。 …

都道府県別の新規求職申込件数の分析1 - 人口1000人当りの申し込み件数は、人口や県内総生産額の小さい都道府県ほど多い

今回は都道府県別の新規求職申込件数のデータを分析してみたいと思います。 データは、政府統計の総合窓口、www.e-stat.go.jpから取得します。 新規求職申込件数(一般)とは,労働市場年報にいう一般職業紹介(常用労働及び臨時・季節労働)の「新規求職申…

景気ウォッチャー調査地域別(現状)のデータ分析4 - R言語で地域をファクタにしてANOVA分析

www.crosshyou.info の続きです。 今回は地域をファクタにしてANOVA分析をしてみたいと思います。 まずは、tapply関数とmean関数で地域別の平均値を出してみます。 沖縄が一番高くて、北関東が一番低いです。 barplot関数で棒グラフにもしてみます。 sort関…

景気ウォッチャー調査地域別(現状)のデータの分析3 - R言語で年をファクタに見立ててANOVA分析

www.crosshyou.info の続きです。 今回は年をファクタに見立ててANOVA分析をしてみたいと思います。 まずは、前回の続き、年別の平均値を見てみましょう。tapply関数、mean関数で年別の平均値を計算して、round関数で小数点以下2桁でまるめています。 2005年…

景気ウォッチャー調査地域別(現状)のデータ分析2 - R言語のtapply関数で年別、月別、地域別に集計する。

www.crosshyou.info の続きです。 今回は、年ごと、月ごと、地域ごとに集計をしようと思います。tapply関数を使えばいいです。 まずは年別の平均値です。 barplot関数で棒グラフにしてみます。 abline関数で50の水準に赤い水平線を引きました。50以上だと景…

景気ウォッチャー調査地域別(現状)のデータ分析1 - データをR言語で読み取り、分析しやすいデータフレームにする。

今回は景気ウォッチャーのデータの分析をしてみようと思います。 内閣府のウェブからデータを取得しました。 ここからエクセルをダウンロードして、今回は、地域別(現状)のデータを使います。 R言語に読込ませるように、少し加工しました。 これをR言語で読…

都道府県別の生活保護被保護実世帯数データの分析6 - R言語で世帯数の伸び率をダミー変数を加えて回帰分析

www.crosshyou.info の続きです。 今回は、世帯数の伸び率をR言語で回帰分析してみたいと思います。 まずは、どのようなデータか再確認します。summary関数を使います。 最低で、1.143倍、最大で1.970倍、平均が1.459倍、中央値が1.517倍です。 hist関数でヒ…

都道府県別の生活保護被保護実世帯数データの分析5 - R言語でGeneralized Additive Model

www.crosshyou.info の続きです。 今回は、gam関数でgeneralized additive modelというのをやってみたいと思います。 Michael J. Crawley の Statistics: An introduction using R Statistics: An Introduction Using R 作者:Michael J. Crawley 出版社/メー…

都道府県別の生活保護被保護実世帯数データの分析4 - R言語で人口当りのデータで回帰分析

www.crosshyou.info の続きです。 前回は生活保護被保護実世帯数そのものを反応変数にして回帰分析をしました。 今回は、人口のデータで割って、人口当りのデータに直して回帰分析してみましょう。 まずは、各変数を人口で割ります。 人口は1000を掛けている…

都道府県別の生活保護被保護実世帯数データの分析3- R言語で回帰分析

www.crosshyou.info 今回はR言語のlm関数で回帰分析をしてみます。 反応変数は、生活保護被保護実世帯数(avgHogo)で、説明変数は人口(avgPop), 可住地面積(acgArea), 県内総生産額(avgGDP)です。 まずは、相関マトリックスを見てみます。 人口(avgPop)と県内…

都道府県別の生活保護被保護実世帯数データの分析2 - R言語で世帯数の伸び率を計算。全体で10年間で1.5倍以上の伸び。埼玉県が一番の伸び率。

www.crosshyou.info の続きです。 今回は、生活保護被保護世帯数の伸び率を計算してみようと思います。 まずは、全国合計の値を計算しましょう。 2006年度の世帯数の合計を計算します。 107万8368世帯です。 2015年度も同じようにします。 162万9754世帯です…

都道府県別の生活保護被保護実世帯数データの分析1 - R言語でCSVファイルのデータを読み込む。大阪府が一番多い。福井県が一番少ない。

今回は、都道府県別の生活保護被保護実世帯数データを分析してみようと思います。 データは、政府統計の総合窓口e-Statから取得します。 まず、47都道府県を選択し、 総人口、可住地面積、県内総生産額と生活保護被保護実世帯数の4つのデータを選択します。…

日銀短観2019年12月調査のデータ分析7 - R言語で企業の規模と現状の景況感で先行きの景況感を分析。(ANCOVA)

www.crosshyou.info の続きです。 今回は、企業の規模というカテゴリカル変数と現状の景況感という実数の変数を組み合わせて先行きの景況感を分析してみたいと思います。 ANCOVA(ANalysis of COVAriance)というものですね。 まずは、横軸に現状の景況感(Now)…

読書記録 - 「オスマン帝国 繁栄と衰亡の600年史」小笠原弘幸 著 (中公新書)

オスマン帝国-繁栄と衰亡の600年史 (中公新書) 作者:小笠原 弘幸 出版社/メーカー: 中央公論新社 発売日: 2018/12/19 メディア: 新書 私の理解は間違っているかもしれないが、 オスマン帝国は600年もの間、ずっと男子の系統の一族が統治していた。その理由は…