2026-04-01から1ヶ月間の記事一覧
UCI Machine Learning Repository の Obesity データの分析2 - 探索的データ分析: EDA (Exploratory Data Analysis) の実践その1
www.crosshyou.info の続きです。今回は 探索的データ分析: EDA (Exploratory Data Analysis) という作業をしていきます。このデータの目的は、obesity の7つのカテゴリーを予測する、ということですから、obesity と他の変数の関係性を調べようと思います。…
今回からしばらくは、UCI Machine Learning Repository の Obesity(肥満)のデータを使ってみたいと思います。 Estimation of Obesity Levels Based On Eating Habits and Physical Condition [Dataset]. (2019). UCI Machine Learning Repository. https://d…
www.crosshyou.info の続きです。今回は勾配ブースティングモデルで所見率を回帰分析してみます。 xgboost パッケージを読み込みます。 説明変数(per_jushin, log_place, log_jushin)を行列に変換します。 shokenritsu を被説明変数として取り出します。 XGB…
オベリスクの門 〈破壊された地球〉三部作 (創元SF文庫) 作者:N・K・ジェミシン 東京創元社 Amazon <破壊された地球>三部作の第2作目です。 前作は、エッスン、アマダ、サイアナイトの三人の話が交互に語られるという話でしたが、今作はエッスンとその娘の…
www.crosshyou.info の続きです。前回は lm() 関数を使って、線形モデルで重回帰分析をしました。R-squared は 0.22 ということで残念ながら線形モデルでは、所見率は上手く説明できないようでした。そこで今回は決定木モデルを使ってみます。 はじめに rpar…
www.crosshyou.info の続きです。今回は、shokenritsu: 所見率を被説明変数にして重回帰分析をしてみたいと思います。 まずはじめに、per_jushin: 1事業所当たりの受診者数の数、log_place: 事業所の数の対数変換値、log_jushin: 受信者数の対数変換値を説明…
第五の季節 〈破壊された地球〉三部作 (創元SF文庫) 作者:N・K・ジェミシン 東京創元社 Amazon <破壊された地球>三部作の第1作目です。 この三部作で3年連続してヒューゴー賞を受賞したということで、期待をもって読み始めました。読み終わった感想は、…
www.crosshyou.info の続きです。前回は、2017年と2015年の所見率に違いがある、1事業所当たりの受診者数に違いがある、所見率の差と1事業所当たりの受診者数の差には関連はなさそう、ということがわかりました。 今回は、所見率の増減や、1事業所当たりの受…
www.crosshyou.info の続きです。前回のグラフで、shokenritsu: 所見率と per_jushin: 1事業所当たりの受診者数は2015年と2017年で若干の差があるように見えました。今回はもう少し詳しく調べてみます。 t.test() 関数で2015年の shokenritsu と2017年の sho…
グローバル格差を生きる人びと 「国際協力」のディストピア (岩波新書) 作者:友松 夕香 岩波書店 Amazon 作者の友松夕香さんは2003年、JICAの協力隊員として西アフリカのブルキナファソに赴任し、その後は研究者としてずっとアフリカ大陸の研究を続けている…
www.crosshyou.info の続きです。前回はCSVファイルのデータを R に読み込ませました。今回はグラフを描いて、データの様子がどんなものかを把握します。調査年度によってデータが変わっているかどうかをみたいです。 place: 検診実施事業場数 と year を箱…