Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2026-04-01から1ヶ月間の記事一覧

UCI Machine Learning Repository の Obesity データの分析2 - 探索的データ分析: EDA (Exploratory Data Analysis) の実践その1

www.crosshyou.info の続きです。今回は 探索的データ分析: EDA (Exploratory Data Analysis) という作業をしていきます。このデータの目的は、obesity の7つのカテゴリーを予測する、ということですから、obesity と他の変数の関係性を調べようと思います。…

UCI Machine Learning Repository の Obesity データの分析1 - CSVファイルのデータをRに読み込ませる。

今回からしばらくは、UCI Machine Learning Repository の Obesity(肥満)のデータを使ってみたいと思います。 Estimation of Obesity Levels Based On Eating Habits and Physical Condition [Dataset]. (2019). UCI Machine Learning Repository. https://d…

都道府県別の定期健康診断結果報告のデータの分析7 - 勾配ブースティングモデルでの回帰分析

www.crosshyou.info の続きです。今回は勾配ブースティングモデルで所見率を回帰分析してみます。 xgboost パッケージを読み込みます。 説明変数(per_jushin, log_place, log_jushin)を行列に変換します。 shokenritsu を被説明変数として取り出します。 XGB…

読書記録 - 「オベリスクの門 <破壊された地球> 三部作」 N. K. ジェミシン 著 (創元SF文庫)

オベリスクの門 〈破壊された地球〉三部作 (創元SF文庫) 作者:N・K・ジェミシン 東京創元社 Amazon <破壊された地球>三部作の第2作目です。 前作は、エッスン、アマダ、サイアナイトの三人の話が交互に語られるという話でしたが、今作はエッスンとその娘の…

都道府県別の定期健康診断結果報告のデータの分析6 - 決定木モデルでの回帰分析

www.crosshyou.info の続きです。前回は lm() 関数を使って、線形モデルで重回帰分析をしました。R-squared は 0.22 ということで残念ながら線形モデルでは、所見率は上手く説明できないようでした。そこで今回は決定木モデルを使ってみます。 はじめに rpar…

都道府県別の定期健康診断結果報告のデータの分析5 - 所見率を被説明変数にして重回帰分析をする。

www.crosshyou.info の続きです。今回は、shokenritsu: 所見率を被説明変数にして重回帰分析をしてみたいと思います。 まずはじめに、per_jushin: 1事業所当たりの受診者数の数、log_place: 事業所の数の対数変換値、log_jushin: 受信者数の対数変換値を説明…

読書記録 - 「第五の季節 <破壊された地球> 三部作」N. K. ジェミシン 著 (創元SF文庫)

第五の季節 〈破壊された地球〉三部作 (創元SF文庫) 作者:N・K・ジェミシン 東京創元社 Amazon <破壊された地球>三部作の第1作目です。 この三部作で3年連続してヒューゴー賞を受賞したということで、期待をもって読み始めました。読み終わった感想は、…

都道府県別の定期健康診断結果報告のデータの分析4 - 地理的な位置関係との関連を分析

www.crosshyou.info の続きです。前回は、2017年と2015年の所見率に違いがある、1事業所当たりの受診者数に違いがある、所見率の差と1事業所当たりの受診者数の差には関連はなさそう、ということがわかりました。 今回は、所見率の増減や、1事業所当たりの受…

都道県別の定期健康診断結果報告のデータの分析3 - 2015年と2017年の所見率、1事業所当たりの受診者数の比較

www.crosshyou.info の続きです。前回のグラフで、shokenritsu: 所見率と per_jushin: 1事業所当たりの受診者数は2015年と2017年で若干の差があるように見えました。今回はもう少し詳しく調べてみます。 t.test() 関数で2015年の shokenritsu と2017年の sho…

読書記録 - 「グローバル格差を生きる人びと 「国際協力」のディストピア」 友松 夕香 著 (岩波新書)

グローバル格差を生きる人びと 「国際協力」のディストピア (岩波新書) 作者:友松 夕香 岩波書店 Amazon 作者の友松夕香さんは2003年、JICAの協力隊員として西アフリカのブルキナファソに赴任し、その後は研究者としてずっとアフリカ大陸の研究を続けている…

都道府県別の定期健康診断結果報告のデータの分析2 - R で箱ひげ図と散布図を描く

www.crosshyou.info の続きです。前回はCSVファイルのデータを R に読み込ませました。今回はグラフを描いて、データの様子がどんなものかを把握します。調査年度によってデータが変わっているかどうかをみたいです。 place: 検診実施事業場数 と year を箱…