www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

読書記録 - 「戦争はいかに終結したか 二度の大戦からベトナム、イラクまで」 千々和 泰明 著 (中公新書)

戦争はいかに終結したか 二度の大戦からベトナム、イラクまで (中公新書) 作者:千々和泰明 中央公論新社 Amazon 戦争は、優勢勢力側の「将来の危険」と「現在の犠牲」のどちらをより重視するか、というシーソーゲーム中で「紛争原因の根本的解決」か「妥協的…

東証の規模別・業種別のPER・PBRのデータの分析3 - R で t検定と回帰分析の手法で2022年と2024年の違いを調べる

Bing Image Creator で生成 : beautiful landscape photo, blue sky and blue ocean and red flowers. www.crosshyou.info の続きです。前回は箱ひげ図を描いて、2022年と2024年の各データの分布を視覚化しました。 今回は、t検定、回帰分析の手法で統計学的…

東証の規模別・業種別のPER・PBRのデータの分析2 - R で箱ひげ図を描き、2022年と2024年を比較する

Bing Image Creator で生成 : close up of dandelion flowers field, joyful atmosphere, natural photo www.crosshyou.info の続きです。 今回は R で箱ひげ図を作り、2022年と2024年で分布に違いがあるかどうかをみてみましょう。ggplot2 パッケージの geo…

東証の規模別・業種別のPER・PBRのデータの分析1 - データを R に読み込み、summary() 関数で基本統計量を確認する

Bing Image Creator で生成 : Long wide view of emerald mountains 今回は、東証の規模別・業種別のPER・PBRのデータを分析してみます。 その他統計資料 | 日本取引所グループ (jpx.co.jp) 東証のプライム市場が始まった 2022年4月のデータと直近の2023年4…

World Bank's Pregnant women receiving prenatal care (%) data analysis 7 - Random Forest Method with "tidymodel"

Generated by Bing Image Creator: Long view photo of Yakushima Island www.crosshyou.info This post is following of the above post. In the above post, I use Logistinc Regression to predict ninety. In this post I will use Random Forest. I ref…

World Bank's Pregnant women receiving prenatal care (%) data analysis 6 - Classification practice with tidymodels package

Generated by Bing Image Creator: Close up photo of wisteria flowers. www.crosshyou.info In this post, I will do classification practice using tidymodels workflow. I refer to tidymodels - Preprocess your data with recipes First, I make a du…

読書記録 - 「人の心に働きかける経済政策」 翁 邦雄 著 (岩波新書)

人の心に働きかける経済政策 (岩波新書) 作者:翁 邦雄 岩波書店 Amazon 従来のメインストリームの経済学は、人間は、自分にとっての現在及び将来の利益・損失を正確に計算して、常に利益が最大になるように合理的な選択をするもの、という仮定のもとに組み立…

World Bank's Pregnant women receiving prenatal care (%) data analysis 5 - Regression Analysis(one categorical, one numerical) with tidymodels workflow

Generated by Bing Image Creator: Close up photo of yellow roses www.crosshyou.info This post is following of the above post. In this post, I will do regression anaysis using tidymodels workflow. I refere to tidymodels - Build a model To be…

World Bank's Pregnant women receiving prenatal care (%) data analysis 4 - ANOVA with infer package

Generated by Bing Image Creator: long wide range landscape view, early fall season, nature field, photo www.crosshyou.info This post is following of above post.In this post, I will do ANOVA(Analysis of Variance) with infer package of R. Fi…

読書記録 - 「文明の誕生 - メソポタミア、ローマ、そして日本へ」小林 登志子 著

文明の誕生 - メソポタミア、ローマ、そして日本へ (中公新書 2323) 作者:小林 登志子 中央公論新社 Amazon 著者は古代メソポタミア文明が専門のようで、文明に関する論理的な話ではなくて、いまから4000年も前のメソポタミアの社会制度がどうだったかを記述…

World Bank's Pregnant women receiving prenatal care (%) data analysis 3 - Visualizing data with ggplot2 package

UnsplashのNatalia Marcelewiczが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, let's visualize data with ggplot2 package. First, let's make an overall histogram. Many observations are 100% care. Next…

World Bank's Pregnant women receiving prenatal care (%) data analysis 2 - merge care (%) data frame and country meta data frame.

Generated by Bing Image Creator: Long wide range landscape of beautiful beach, photo style www.crosshyou.info This post is following of the above post. CSV files from World Bank web site includes country meta data file like below. I will l…

World Bank's Pregnant women receiving prenatal care (%) data analysis 1 - Loading CSV file data into R

Generated by Bing Image Creator: Landscape of dogwood flowers. I will analyze World Bank's "Pregnant women receivig prenatal care (%) data with R. I got data from https://data.worldbank.org/indicator/SH.STA.ANVC.ZS?view=map The CSV file is…

UCI の Breast Cancer Wisconsin (Diagnostics) のデータ分析6 - R の kernlab パッケージでサポートベクターマシーンで予測正解率 100% を達成

Bing Image Creator で生成: Nemophila menziesii large fields, long landscape view photo www.crosshyou.info の続きです。 今回は、R の kernlab パッケージでサポートベクターマシーンの手法で予測してみます。まず、kernlab パッケージを読み込みます…

UCI の Breast Caner Wisconsin (Diagnostics) のデータ分析5 - R の nnet パッケージでニューラルネットワークの手法で予測

Bing Image Creator で生成: Long wide view of alps mountains and small town, photo style www.crosshyou.info の続きです。 今回は、R の nnet パッケージを利用して、ニューラルネットワーク で予測してみようと思います。 はじめに、nnet パッケージ読…

UCI の Breast Cancer Wisconsin (Diagnostics) のデータ分析4 - R の class パッケージで k-NN (k-nearest neighbors) で予測

Bing Image Creator で生成: Long view landscape, ancient trees, small lakes, some flowers, blue sky, Photo www.crosshyou.info の続きです。 今回は、class パッケージの knn() 関数で k-nearest neighbors の手法で M を予測します。 class パッケー…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析3 - R の rpart パッケージで決定木モデルで予測

Bing Image Creator で生成: blue sky, green grass, white clouds, some flowers, cheerful image photo www.crosshyou.info の続きです。 今回は、R の rpart パッケージで決定木モデル (decision tree model) で予測をしてみます。 Rによるデータサイエン…

読書記録 - 「エピジェネティクス - 新しい生命像をえがく」 仲野 徹 著 (岩波新書)

エピジェネティクス-新しい生命像をえがく (岩波新書) 作者:仲野 徹 岩波書店 Amazon エピジェネティクスの「エピ」というのはギリシャ語の接頭辞で、「後で」とか「上の」という意味だそうです。「ジェネティクス」というのが遺伝子とか遺伝のことなので、…

読書記録 - 「菜根譚: 中国の処世訓」 湯浅 邦弘 著 (中公新書)

菜根譚: 中国の処世訓 (中公新書 2042) 作者:湯浅 邦弘 中央公論新社 Amazon 「菜根譚」という中国の明の時代に書かれた処世訓の解説本です。 中国の3つの大きな思想、儒教、道教、仏教のうち、儒教をベースにして道教、仏教を取り入れて書かれているとのこ…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析2 - ロジスティクス回帰と LASSO 回帰で判別

Bing Image Creator で生成: Early Spring in rural area, peaceful landscape, photo www.crosshyou.info の続きです。前回はデータを R に読み込んで、分析のための前処理をしました。 今回は実際に予測をしてみます。 はじめに、データの様子を見るために…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析1 - R にデータを読み込み、分析のための前処理をする

Bing Image Creator で生成: Tropical rainforest with a big flower, photo 今回は、UCI の Breast Cancer Wisconsin (Diagnostic) のデータを R で分析してみようと思います。Wolberg,William, Mangasarian,Olvi, Street,Nick, and Street,W.. (1995). Bre…

都道府県別の水質汚濁物排出量総合調査のデータ分析7 - R で階層的クラスタリング

Bing Image Creator で生成: Summer season, Landscape, Green Mountains which have snow on the top, yellow flowers, Photo www.crosshyou.info の続きです。 今回は、R で階層的クラスタリングをしてみようと思います。 まずは、クラスタリングのための…

都道府県別の水質汚濁物排出量総合調査のデータ分析6 - R で水質が改善した都道府県、悪化した都道府県を調べた。

Bing Image Creator で生成: Blue image landscape, Japanese local area, splendid moment, photo style www.crosshyou.info の続きです。 前回は、R でシミュレーションベースの回帰分析を実行しました。l_quality は l_quantity, l_fuka と関連があること…

都道府県別の水質汚濁物排出量総合調査のデータ分析5 - R の infer で tidy な 重回帰分析 (Multiple Regression Analysis)

Bing Image Creator で生成: North Area Landscape, breezing wind, photograph style www.crosshyou.info の続きです。前回は、R の infer パッケージを利用して、ANOVA(Analysis of Variance) 分析をしました。今回は、infer パッケージで Multiple Regres…

都道府県別の水質汚濁物排出量総合調査のデータ分析4 - R の infer で tidy な ANOVA(Analysis of Variance) 分析

Bing Image Creator で生成: Photo, landscape of higher mountains and great fall, a few flowers, white clouds, blue sky www.crosshyou.info の続きです。前回は箱ひげ図を作成して、生活環境項目 5 項目ごとのデータの分布を見ました。前々回はヒスト…

読書記録 - 「法とは何か 新版」 渡辺 洋三 著 (岩波新書)

法とは何か 新版 (岩波新書) 作者:渡辺 洋三 岩波書店 Amazon 旧版は 1979 年に出版され、この新版は 1998 年に出版されています。 新版とはいえ、四半世紀以上昔の本なので、現代の法律制度とは違っている部分があるので、その点は注意が必要かと思いました…

都道府県別の水質汚濁物質排出量総合調査のデータ分析3 - R で箱ひげ図を作成して、各生活環境項目別のデータを視覚化する

Bing Image Creatorで生成: Landscape, southern islands, green grass, white cloud, tiny flowers, photo www.crosshyou.info の続きです。前回は各年度別のヒストグラムを作成しました。年度によって大きな違いはなさそうでした。 今回は、five: 生活環境…

都道府県別の水質汚濁物質排出量総合調査のデータ分析2 - R でヒストグラムを作成して、各年度の分布を視覚化する

Bing Image Creatorで生成: Photo, Landscape in Summer season, quiet sense of wonder, hibiscus flowers www.crosshyou.info の続きです。 前回は各変数の度数や平均値などの統計量を調べました。 今回は変数のデータを視覚化してみます。 num: 事業場数…

都道府県別の水質汚濁物質排出量総合調査のデータ分析1- R に CSV ファイルのデータを読み込み、分析用のデータフレームを作成する。

Bing Image Creatorで生成: Photo, Spring Landscape, quiet flower garden今回は、都道府県別の水質汚濁物質排出量総合調査のデータを分析してみようと思います。政府統計の総合窓口(www.e-stat.go.jp)からデータを取得します。 こんな感じのデータです。 …

都道府県別の自動車(バス)輸送統計調査のデータ分析8 - R の princomp() 関数で主成分分析

Bing Image Generatorで生成: Photo, Winter snow field with red cameria www.crosshyou.info の続きです。 今回は、R で主成分分析をしてみようと思います。 Rによるデータサイエンス(第2版):データ解析の基礎から最新手法まで 作者:金 明哲 森北出版 Amaz…