Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2025-08-01から1ヶ月間の記事一覧

読書記録 - 「アメリカ海兵隊: 非営利組織の自己革新」 野中 郁次郎 著 (中公新書)

アメリカ海兵隊: 非営利型組織の自己革新 (中公新書 1272) 作者:野中 郁次郎 中央公論新社 Amazon アメリカ独立戦争のときに、英国に海兵隊という組織があるから、という単純な理由で結成されたアメリカ海兵隊が、水陸両用作戦という画期的な概念を生み出し…

都道府県別の病院報告のデータの分析 6 - infer パッケージのワークフローでt検定

www.crosshyou.info の続きです。前回は、t.test()関数で令和5年の精神科病院の在院患者数の比率と令和3年の比率を比較して、統計的に有意な差は認められないことを確認しました。 今回は、inferパッケージのワークフローを適用して、コンピューターシミュレ…

都道府県別の病院報告のデータの分析 5 - 精神科病院の在院患者数の比率 - 令和3年と令和5年の比較

www.crosshyou.info の続きです。 今回は令和3年と令和5年の精神科病院の患者数の比率を比較して、比率が増えているのか、減っているのかをみてみましょう。 令和3年の精神科病院の患者数の比率を確認します。 在院患者数の比率は0.193が平均値です。 令和5…

tidymodelsのワークフローに沿った回帰とクラシフィケーションの方法のサンプルコード

自分の忘備録として残しておきます。(最終更新日: 2025-08-24) ####################################################### ######## tidymodelsで回帰分析・2値の分類をする方法 ######## ################################################################…

都道府県別の病院報告のデータの分析 4 - 各データの地理的な傾向を調べる。

www.crosshyou.info の続きです。今回は、各データが地理的な傾向があるかどうかを見てみたいと思います。まず、したの図のようなCSVファイルをCopilotに相談して作りました。 これを読み込みます。 これを基のデータフレーム、dfと結合します。 これで準備…

都道府県別の病院報告のデータの分析 3 - 精神科病院の患者数の比率の分析

www.crosshyou.info の続きです。今回はseishin: 精神科病院の患者数がどのくらいの比率を占めるかに注目してみます。 まず、seishin / total を計算して比率を計算します。 それでは、どこの都道府県が比率が高いか低いかを確認します。 まず、在院患者数の…

読書記録 - 「戦争と法 命と暮らしは守られるのか」 永井 幸寿 著 (岩波新書)

戦争と法 命と暮らしは守られるのか (岩波新書) 作者:永井 幸寿 岩波書店 Amazon 戦争になったとき、私たちの暮らしは守れるのでしょうか?この本を読むと、「守られない」ということがわかります。 軍隊は国を守りますが、この国というのは、私たち一般市民…

都道府県別の病院報告のデータの分析 2 - 在院患者数の多い都道府県、少ない都道府県はどこか?

www.crosshyou.info の続きです。 どこの都道府県が患者数が多いか・少ないかをみてみます。 まずは、在院患者数の多いところをみてみます。 高知県、鹿児島県、長崎県が上位3件です。高知県の令和3年度は、人口10万人当たりの在院患者数が1866人でした。 少…

都道府県別の病院報告のデータの分析 1 - Rにデータを取り込む

今回からしばらくは、都道府県別の病院報告のデータの分析をしたいと思います。 政府統計の総合窓口、e-statのウェブサイトからデータを取得します。 令和5年の人口10万人対1日平均患者数のデータと 令和3年のデータを取得します。 ダウンロードしたファイル…

2010年から2024年のプロ野球の成績のデータの分析 8 - ランダムフォレストがロジスティクス回帰に負けることもある。

www.crosshyou.info の続きです。今回はランダムフォレストで予測してみます。 まず、モデルを作成します。エンジンは randomForest を使いました。 mtryなどのハイパーパラメータはあとでチューニングします。 レシピの作成をします。 文字列型データのダミ…

読書記録 - 「恐竜大絶滅 陸・海・空で何が起きていたのか」 土屋 健 著 (中公新書)

恐竜大絶滅 陸・海・空で何が起きていたのか (中公新書) 作者:土屋健 中央公論新社 Amazon 恐竜が絶滅したのは、いまから約6600万年前に巨大な隕石が地球に落下して、その衝突の影響で絶滅しました。 この巨大隕石の落下が原因で絶滅した生物は恐竜の他にも…

2010年から2024年のプロ野球の成績のデータの分析 7 - セリーグ・パリーグを分類する - ロジスティクス回帰で分類

gl www.crosshyou.info の続きです。今回はセリーグ・パリーグを分類するということをやってみます。 まず、分類用のデータフレームを作成しましょう。 最初にtidymodelsパッケージの読み込みをしておきます。 tidymodels_prefer()関数でtidymodelsパッケー…

2010年から2024年のプロ野球の成績のデータの分析 6 - 試合巧者のチームはどこか?

www.crosshyou.info の続きです。 前回の分析で、勝率 = 0.25 + 0.04 * 安打数 + 0.09 + 本塁打数 + 0.06 * 盗塁数 + 0.01 * 奪三振数 - 0.07 * 失点数 というモデルを推計しました。 今回はこのモデルで推定した勝率と実際の勝率を比較して、モデルの推定値…