Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2025-06-01から1ヶ月間の記事一覧

読書記録 - 「世界の貧困に挑む マイクロファイナンスの可能性」 慎 泰俊 著 (岩波新書)

世界の貧困に挑む マイクロファイナンスの可能性 (岩波新書) 作者:慎 泰俊 岩波書店 Amazon 著者は、五常・アンド・カンパニーというマイクロファイナンスの会社の創業者です。 マイクロファイナンスという事業を通して、世界の人々が貧困から脱却できるよう…

賃金構造基本調査のデータ分析 6 - 線形モデルで予測 - tidymodels パッケージを利用して

www.crosshyou.info の続きです。前回は tidymodels の initial_split() 関数でデータをトレーニング用とテスト用に分けました。今回は線形モデルを一つ作って簡単な予測をしてみます。 線形モデルは、linear_reg() で定義します。 そして、set_engine() で…

賃金構造基本調査のデータ分析 5 - tidymodels パッケージを使って全体のデータをトレーニング用とテスト用に分割する。

www.crosshyou.info の続きです。前回は給与額を他の変数で重回帰分析しました。計量経済学っぽいことをしました。今回からはそれらの変数で給与額を予測するモデルを作るというデータサイエンスっぽいことをしていこうと思います。まだまだ勉強の途中ですが…

賃金構造基本調査のデータ分析 4 - 重回帰分析で決まって支給する現金給与額と他の変数の関係を調べる。

www.crosshyou.info 前回はsalary: 決まって支給する現金給与額【千円】と各変数の関係を視覚化しました。 今回はそれらの変数で重回帰分析をしてみたいと思います。 私の頭の中にあるモデル式は、 現金給与額 = beta0 + 年ダミー + 業種ダミー + 性別ダミー…

賃金構造基本統計調査のデータ分析 3 - 決まって支給額する現金給与額と他の変数の関係を視覚化する。

www.crosshyou.info の続きです。各変数の分布の様子は確認できたので、今回は一つの変数、具体的には salary: 決まって支給する現金給与額【千円】について詳しくみてみます。 まずは、小さい順、大きい順にデータフレームを並び替えます。 arrange()関数を…

賃金構造基本統計調査のデータ分析 2 - 各変数のヒストグラムを作成して、データの分布の様子を把握する

www.crosshyou.info 今回は前回、データフレームとして取り込んだ各変数がどんな様子なのかをヒストグラムを使って見てみます。 その前にとりあえず、~~~_code という変数をファクター型の変数に変えておきました。 最初は、age: 年齢のヒストグラムを作成し…

読書記録 - 「国鉄 - 「日本最大の企業」の栄光と崩壊」 石井 幸孝 著 (中公新書)

国鉄―「日本最大の企業」の栄光と崩壊 (中公新書 2714) 作者:石井 幸孝 中央公論新社 Amazon 著者はJR九州の初代社長です。300ページ以上もあって新書にしては分厚い本でした。 国鉄時代は乗客のことを「利用客」と呼んでいたこと、筆者がJR九州の社長になっ…

賃金構造基本統計調査のデータの分析 1 - R にデータを取り込む

(Bing Image Creatorで生成: prompt: Photos of natural scenery, a solitary island in Japan, with yellow flowers blooming all over.) 今回からしばらくは、賃金構造基本統計調査のデータを分析してみたいと思います。 まず、政府統計の総合窓口、www.e-…

UCI の National Poll in Health Aging (NPHA) のデータの分析 9 - ランダムフォレストで予測する

(Bing Image Creator で生成: プロンプト: Close up of lotus flowers, which are real, photo) www.crosshyou.info の続きです。 今回は、randomForestパッケージで、ランダムフォレストで予測してみます。 まず、パッケージを読み込みます。 モデルをフィ…

UCI の National Poll in Health Aging (NPHA) のデータの分析 8 - ニューラルネットワークで予測する

(Bing Image Creator で生成: プロンプト: Close up of natural flowering morning glory flower, violet one and pink one , photo) www.crosshyou.info 今回はニューラルネットワークで予測してみます。 neuralnet パッケージを読み込みます。 neuralnet()…

時系列データの分析 9 - Static Log-Log モデルの Serial Correlation の有無をチェックして、Serial Correlation Robust Inference

(Bing Image Creator で生成: プロンプト: Nature landscape, long view of sand desert, close up of yellow and red cactus flowers, photo.) www.crosshyou.info の続きです。今回は Log-LogモデルでのSerail Correlationの有無をチェックしたいと思いま…