Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2023-06-01から1ヶ月間の記事一覧

都道府県別の工業統計調査のデータの分析7 - RでHeteroskedasticity Robust Inference とWLS(Weighted Least Square)

UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info の続きです。 前回は、Rのlm()関数で線形回帰分析をしました。そして、そのモデルはHeteroskedasticityだとわかりました。このときの対処方法は、ひとつは、Heteroskedasticity Robustな標…

都道府県別の工業統計調査のデータの分析6 - Rのlm()関数で線形回帰分析を実行して、Heteroskedasticityをチェックした。

UnsplashのEugene Golovesovが撮影した写真 www.crosshyou.info の続きです。 今回は、Rで回帰分析をしてみたいと思います。 被説明変数を gdp : 県内総生産額にして、説明変数を num_jin, sta_num, sal_sta, inp_num, out_inp, add_staにしてみます。 まず…

読書記録 - 「プルトニウムの恐怖」 高木 仁三郎 著 岩波新書

プルトニウムの恐怖 (岩波新書) 作者:高木 仁三郎 岩波書店 Amazon 1981年に出版された本ですが、2023年の今でも読める本だと思います。 最近、SDGs(持続可能な開発目標)や脱炭素を推進しよう!と言っている人の中に、石炭・石油の火力発電から原子力発電に…

都道府県別の工業統計調査のデータの分析5 - クラスタリングするときはデータを標準化することが大事

UnsplashのMarjolein vVが撮影した写真 www.crosshyou.info の続きです。 前回はクラスタリング分析をしたのですが、少し気になる結果になりました。 それは、 このように、inp_numの値ではっきりとグループが分かれたことです。 考えてみると、クラスタリン…

都道府県別の工業統計調査のデータの分析4 - Rでクラスタリング分析 - 東京都と沖縄県は似ている。

UnsplashのKatie Aziが撮影した写真 www.crosshyou.info の続きです。 今回は、クラスタリング分析をしてみます。 まず、クラスタリング分析をするためのマトリックスオブジェクトを作成します。 今回は、num_jin : 人口当たりの事業所の数、sta_num : 事業…

都道府県別の工業統計調査のデータの分析3 - ひとつひとつの工場の規模が大きいのは山口県

UnsplashのAnthony DELANOIXが撮影した写真 www.crosshyou.info の続きです。 引き続き、各変数をグラフにしていきます。まずは、input : 原材料使用額(百万円単位)です。 summary()関数で基本統計値を確認します。 一番少ないところは、3434億円、一番多い…

都道府県別の工業統計調査のデータの分析2 - 事業所の数は大阪府が多い、現金給与総額は愛知県が多い。

UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info 今回のブログは前回の続きです。前回はCSVファイルのデータをRに読み込ませました。 それでは、一つ一つの変数を詳しくみていきましょう。 まずは、num: 事業所の数です。summary()関数で基…

都道府県別の工業統計調査のデータの分析1 - データをRに読み込ませる。

UnsplashのOpal Siegalが撮影した写真 今回からしばらくは、都道府県別の工業統計調査のデータを分析してみたいと思います。 データは、政府統計の総合窓口、e-stat.go.jp から取得します。 こんな感じのデータです。 これをCSVファイルに出力します。 この…

読書記録 - 「月はすごい - 資源・開発・移住」 佐伯 和人 著 中公新書

月はすごい-資源・開発・移住 (中公新書) 作者:佐伯 和人 中央公論新社 Amazon 月への探査活動が盛り上がっているとのことです。 この本は、月に関する基礎知識、例えば、月は毎日50分ぐらい夜空に昇ってくるのが遅くなるなど、という話から始まって、月の地…

OECD Adult education level data analysis 9 - regression analysis with panel data using R

UnsplashのMartin Sanchezが撮影した写真 www.crosshyou.info This post is following of the above post. In the previous post, I made a panel data frame, n = 37, T = 2, N = 74. In this post, I do regression analysis with the panel data frame. F…

OECD Adult education level data analysis 8 - Making panel data frame using R plm package

UnsplashのDaniel Pelaez Duqueが撮影した写真 www.crosshyou.info This post is following of the above post. In the previous post, I did regression analysis with time-series data. Unfortunately, I cannot make a statistically significant model.…