crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の1住宅当たり延べ面積のデータの分析4 - R言語のlm関数で回帰分析。家の広さは、裕福なほど広い。

www.crosshyou.info の続きです。 今回はnobe: 1住宅当たりの延べ面積(m2)を他の変数で回帰分析します。 前回の分析で東京都が特殊な感じだったので、東京都なら1、そうでないなら0のダミー変数を作っておきました。 lm関数で回帰分析モデルを作ります。 sum…

都道府県別の1住宅当たり延べ面積のデータの分析3 - R言語でヒストグラムや散布図を描く。

www.crosshyou.info の続きです。 今回はR言語でヒストグラムや散布図を描いてみます。 まずは、nobe: 1住宅当たり延べ面積(m2)のヒストグラムです。 facet_grid()をつかって年度ごとにヒストグラムを描きました。年度による違いはあまりないようですね。 次…

都道府県別の1住宅当たり延べ面積のデータの分析2 - R言語のデータフレームをいろいろ加工する。

www.crosshyou.info の続きです。 今回は、R言語のmutate関数を使って、mitsudo: 人口密度、per_capita17: 1人当りの県内総生産額(平成17年基準)、per_capita23: 1人当たりの県内総生産額(平成23年基準)、per_setai: 1世帯当たりの人数を作ります。 summary…

都道府県別の1住宅当たり延べ面積のデータの分析1 - R言語のread_csv関数でデータを読み込む。

今回は都道府県別の1住宅当たり延べ面積(m2)のデータを分析しようと思います。 データは、政府統計の総合窓口、e-statのサイトから取得します。 www.e-stat.go.jp 47の都道府県を選びます。 1住宅当り延べ面積に関係ありそうなデータとして、人口密度、経済…

都道府県別の健康寿命のデータの分析4 - R言語のlm関数で健康寿命を回帰分析する。経済的に豊かなほど、健康寿命は長い。

www.crosshyou.info の続きです。 今回はR言語のlm関数で、健康寿命を回帰分析してみます。 まず、na.omit関数でNAのないデータフレームを作成します。 yearとprefのlengthが47となっています。一つの調査年度だけということですね。 head関数ではじめの数行…

読書記録 - 「新型コロナの科学 パンデミック、そして共生の未来へ」黒木登志夫 著 (中公新書)

新型コロナの科学 パンデミック、そして共生の未来へ (中公新書) 作者:黒木登志夫 発売日: 2021/02/16 メディア: Kindle版 厚生労働省が無症状の人へPCR検査をするのに反対していたことや、安倍晋三の取り巻きのダメダメな政策(アベノマスク、小中高の一斉休…

都道府県別の健康寿命のデータの分析3 - R言語でデータフレームの並び替え。山梨県が一番長く、大阪府が一番短い。

www.crosshyou.info の続きです。 今回はどの都道府県が健康寿命が長いのかを調べます。 2010年度の男性の健康寿命の長い上位の都道府県はどこでしょうか? 愛知県と静岡県が71.7歳でトップです、千葉県、茨城県、山梨県、長野県と続きます。 2010年度の女性…

都道府県別の健康寿命のデータの分析2 - 健康寿命は女性のほうが長く、年を経るごとに伸びている。

www.crosshyou.info の続きです。 今回は調査年度別の健康寿命の値を見てみます。 R言語のgroup_by関数で調査年度別にグループ化してから、summarise関数の中でmean関数で平均値、sd関数で標準偏差、length関数でデータ数、qt関数などで信頼区間を計算してい…

都道府県別の健康寿命のデータの分析1 - R言語でデータを読み込む。2016年度の熊本県のデータが欠損している。

今回は都道府県別の健康寿命のデータについて調べてみようと思います。 データはいつものように、政府統計の総合窓口e-statから取得します。 データ表示 | 都道府県データ | 社会・人口統計体系 | 地域から探す | 政府統計の総合窓口 (e-stat.go.jp) 地域は4…

都道府県別の所定内給与額のデータの分析7 - R言語のlm関数で重回帰分析をする

www.crosshyou.info の続きです。今回は2017年度の男女の1日当りの所定内給与額の比率を2005年度のデータを使って重回帰分析をしてみたいと思います。 まず、filter関数をつかって2005年度だけのデータフレームを用意します。 このdf_2005というデータフレー…

都道府県別の所定内給与額のデータの分析6 - R言語のbroomパッケージを絡ませてlm関数で回帰分析をする。

www.crosshyou.info 今回は、男性の1日当りの所定内給与額と女性の1日当りの所定内給与額の回帰分析をしてみたいと思います。 Introduction to Data Science: Data Analysis and Prediction Algorithms with R (Chapman & Hall/CRC Data Science Series) (En…

都道府県別の所定内給与額のデータの分析5 - R言語で2005年度と2017年度の男女格差を比較する。var.test関数とt.test関数

www.crosshyou.info の続きです。 今回は2005年度と2017年度の男女格差を比較してみようと思います。 まず、2005年度と2017年度だけのratio: 男女の1日当りの所定内給与額の比率のデータフレームを作ります。 summary関数で概要をみてみます。 2005年度の平…

都道府県別の所定内給与額のデータの分析4- R言語で男女の給与額の格差を見る。沖縄県が一番格差が小さい。

www.crosshyou.info の続きです。 前回は男女の所定内給与額を見ました。 今回は、その比率を計算することからはじめます。 R言語のmutate関数を使います。 ratio: 男性の1日当りの所定内給与額/女性の1日当りの所定内給与額としましたので、値が大きいほど…

都道府県別の所定内給与額のデータの分析3 - 女性のほうが会議が長くなるのはわからないが、所定内給与額が低いのは確かだ。

www.crosshyou.info の続きです。 今回はR言語でヒストグラムを描きます。 一番新しい調査年度のデータで描きましょう。 dfの一番新しい調査年度はいつでしょうか? 2018年度です。 2018年度の所定内給与額の分布状況をヒストグラムでみてみます。 男性のほ…

都道府県別の所定内給与額のデータの分析2 - R言語のggplot2でグラフを作成する。青森県の男性より、東京都の女性のほうが高給取りだ。

www.crosshyou.info の続きです。 今回はggplot2パッケージでグラフを描きます。 まずは、年度ごとの所定内給与額の平均値をみてみましょう。 青が男性で赤が女性です。 男性は1996年頃から伸びが頭打ちです。 次は、都道府県の平均値です。 こちらも青が男…

都道府県別の所定内給与額のデータの分析1 - R言語でデータを読み込む。女性の1日当りの給与額が一番バラツキが大きい。

今回は都道府県別の所定内給与データの分析をしてみたいと思います。 データは、政府統計の総合窓口(e-stat)か取得します。 www.e-stat.go.jp 47都道府県を選択して、 男女別の所定内給与額と労働日数の4つのデータを選択しました。 このようなファイルです…

都道府県別のケーブルテレビ加入世帯数のデータの分析6 - R言語で階層的クラスタリングをする。

www.crosshyou.info の続きです。 今回はR言語で階層的クラスタリングをしてみます。 まず、select関数でtv_gr: テレビ放送受信契約数の伸び, catv_gr: ケーブルテレビ加入世帯数の伸び, bb_gr: ブロードバンドサービス契約数の伸びだけを選択して、as.matri…

都道府県別のケーブルテレビ加入世帯数のデータの分析5 - ブロードバンドサービス契約数の伸びを回帰分析する。

www.crosshyou.info の続きです。 今回は、bb_gr: ブロードバンドサービス契約数の伸びを他の変数で回帰分析してみようと思います。 まず、散布図マトリックスを描いてみます。R言語のplot関数を使います。 tv_2010, catv_2010, bb_2010は分布が左右対称では…

都道府県別のケーブルテレビ加入世帯数のデータの分析4 - R言語で平均値の信頼区間をパラメトリック法とブートストラップ法で求める。

www.crosshyou.info の続きです。 前回作成した、それぞれの伸び率、tv_gr: テレビ放送受信契約数の伸び、catv_gr: ケーブルテレビ加入世帯数の伸び、 bb_gr: ブロードバンドサービス契約数の伸びの平均値の信頼区間を調べてみようと思います。 まずは、パラ…

都道府県別のケーブルテレビ加入世帯数のデータの分析3 - テレビ放送受信契約数、ケーブルテレビ加入世帯数、ブロードバンドサービス契約数、それぞれの伸びを計算する。

www.crosshyou.info の続きです。 前回は東京都のブロードバンドサービス契約数がとても大きな伸び率だとわかりました。今回は47都道府県の2010年度から2017年度のtv: テレビ放送受信契約数、catv: ケーブルテレビ加入世帯数、bb: ブロードバンドサービス契…

都道府県別のケーブルテレビ加入世帯数のデータの分析2 - 東京都のブロードバンド契約数の伸びは凄い。

www.crosshyou.info の続きです。 まず、year: 調査年度が何年度からあるのかを確認しましょう。 2010年度から2017年度までの8年間のデータがあります。 こんどは、それぞれの数値型の変数の平均値、標準偏差、変動係数の年度ごとの数値をみてみます。 tv: …

読書記録 - 「地域衰退」宮崎雅人 著 岩波新書

地域衰退 (岩波新書 新赤版 1864) 作者:宮崎 雅人 発売日: 2021/01/22 メディア: 新書 平成の大合併によって自治体の数は減ったが、それが地域の衰退の歯止めにになったとは言えないようだ。 農業でも農業法人を作って規模を大きくしてもあまりうまくいけな…

都道府県別のケーブルテレビ加入世帯数のデータの分析1 - R言語のread_csv関数でCSVファイルを読み込む。

今回は都道府県別のケーブルテレビ加入世帯数のデータの分析をしてみようと思います。 データは、政府統計の総合窓口(www.e-stat.go.jp)から取得します。 47都道府県を選択し、 ケーブルテレビ加入者世帯数の他、テレビ放送受信契約とブロードバンドサービス…

都道府県別のデジタル教科書の整備率のデータの分析7 - R言語のglm関数でロジスティクス回帰分析をする。

www.crosshyou.info の続きです。 今回はR言語のglm関数でロジスティクス回帰分析をします。よく考えたら、整備率のデータは0%か100%と、取り得る値の範囲が決まっていますから、lm関数で単純な線形回帰よりもglm関数でロジスティクス回帰分析をしてほうが当…

都道府県別のデジタル教科書の整備率のデータの分析6 - R言語のlm関数で回帰分析をする。高等学校のデジタル教科書の整備率は中学校のデジタル教科書の整備率と高等学校のPC台数に関連がある。

www.crosshyou.info の続きです。 前回は2017年のデータだけで回帰分析をしました。 今回はその他の調査年のデータも入れて分析してみます。 p-valueは2.2e-16より小さいので有意なモデルです。pc_hとdg_cの係数のp値が0.05で有意です。pc_hの値が低いほど、…

都道府県別のデジタル教科書の整備率のデータの分析5 - R言語のlm関数で回帰分析をする。

www.crosshyou.info の続きです。 今回はdg_h: 高等学校のデジタル教科書の整備率をその他の変数で回帰分析してみます。R言語のlm関数を使います。 p-valueは0.01039なので有意なモデルです。各変数の係数のp値を見ると、pc_h: 高等学校のPC1台当たりの児童…

都道府県別のデジタル教科書の整備率のデータの分析4 - R言語のdist関数、hclust関数、plot関数でクラスター分析

www.crosshyou.info の続きです。 今回はクラスター分析をしてみます。 まずは、データフレームをマトリックスに変換します。as.matrix関数を使います。 rownames関数でマトリックスの行名を都道府県にしました。 マトリックスにしたらあとは、簡単です。 こ…

都道府県別のデジタル教科書の整備率のデータの分析3 - R言語のrep関数とseq関数を利用して相関係数マトリックスを加工する。

www.crosshyou.info の続きです。 2017年度だけのデータフレームを作りました。 cor関数で相関係数マトリックスを作成しました。 pc_sとpc_cの相関係数は0.79と高い強い正の相関があります。dg_hとpc_hは-0.397と負の相関があります。 Rによるやさしい統計学…

都道府県別のデジタル教科書の整備率のデータの分析2 - R言語でデータを視覚化。佐賀県は中学・高校の整備率が100%

www.crosshyou.info の続きです。今回はR言語のggplot2パッケージのgeom_boxplot関数で箱ひげ図、geom_point関数で散布図、geom_line関数で折れ線グラフをつくり、データを視覚化します。 まずは、pc_s: 小学校のPC1台当たりの児童数からです。 全体的に年を…

都道府県別のデジタル教科書の整備率のデータの分析1 - R言語のread_csv関数でCSVファイルのデータを読み込む。

今回は都道府県別のデジタル教科書の整備率のデータの分析をしてみようと思います。 データは、政府統計の総合窓口(www.e-stat.go.jp)から取得しました。 47都道府県を選択し、 デジタル教科書の整備率と関連のありそうな教育用コンピュータ1台当たりの児童…