Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2024-04-01から1ヶ月間の記事一覧

UCI の Breast Caner Wisconsin (Diagnostics) のデータ分析5 - R の nnet パッケージでニューラルネットワークの手法で予測

Bing Image Creator で生成: Long wide view of alps mountains and small town, photo style www.crosshyou.info の続きです。 今回は、R の nnet パッケージを利用して、ニューラルネットワーク で予測してみようと思います。 はじめに、nnet パッケージ読…

UCI の Breast Cancer Wisconsin (Diagnostics) のデータ分析4 - R の class パッケージで k-NN (k-nearest neighbors) で予測

Bing Image Creator で生成: Long view landscape, ancient trees, small lakes, some flowers, blue sky, Photo www.crosshyou.info の続きです。 今回は、class パッケージの knn() 関数で k-nearest neighbors の手法で M を予測します。 class パッケー…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析3 - R の rpart パッケージで決定木モデルで予測

Bing Image Creator で生成: blue sky, green grass, white clouds, some flowers, cheerful image photo www.crosshyou.info の続きです。 今回は、R の rpart パッケージで決定木モデル (decision tree model) で予測をしてみます。 Rによるデータサイエン…

読書記録 - 「エピジェネティクス - 新しい生命像をえがく」 仲野 徹 著 (岩波新書)

エピジェネティクス-新しい生命像をえがく (岩波新書) 作者:仲野 徹 岩波書店 Amazon エピジェネティクスの「エピ」というのはギリシャ語の接頭辞で、「後で」とか「上の」という意味だそうです。「ジェネティクス」というのが遺伝子とか遺伝のことなので、…

読書記録 - 「菜根譚: 中国の処世訓」 湯浅 邦弘 著 (中公新書)

菜根譚: 中国の処世訓 (中公新書 2042) 作者:湯浅 邦弘 中央公論新社 Amazon 「菜根譚」という中国の明の時代に書かれた処世訓の解説本です。 中国の3つの大きな思想、儒教、道教、仏教のうち、儒教をベースにして道教、仏教を取り入れて書かれているとのこ…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析2 - ロジスティクス回帰と LASSO 回帰で判別

Bing Image Creator で生成: Early Spring in rural area, peaceful landscape, photo www.crosshyou.info の続きです。前回はデータを R に読み込んで、分析のための前処理をしました。 今回は実際に予測をしてみます。 はじめに、データの様子を見るために…

UCI の Breast Cancer Wisconsin (Diagnostic) のデータ分析1 - R にデータを読み込み、分析のための前処理をする

Bing Image Creator で生成: Tropical rainforest with a big flower, photo 今回は、UCI の Breast Cancer Wisconsin (Diagnostic) のデータを R で分析してみようと思います。Wolberg,William, Mangasarian,Olvi, Street,Nick, and Street,W.. (1995). Bre…

都道府県別の水質汚濁物排出量総合調査のデータ分析7 - R で階層的クラスタリング

Bing Image Creator で生成: Summer season, Landscape, Green Mountains which have snow on the top, yellow flowers, Photo www.crosshyou.info の続きです。 今回は、R で階層的クラスタリングをしてみようと思います。 まずは、クラスタリングのための…

都道府県別の水質汚濁物排出量総合調査のデータ分析6 - R で水質が改善した都道府県、悪化した都道府県を調べた。

Bing Image Creator で生成: Blue image landscape, Japanese local area, splendid moment, photo style www.crosshyou.info の続きです。 前回は、R でシミュレーションベースの回帰分析を実行しました。l_quality は l_quantity, l_fuka と関連があること…

都道府県別の水質汚濁物排出量総合調査のデータ分析5 - R の infer で tidy な 重回帰分析 (Multiple Regression Analysis)

Bing Image Creator で生成: North Area Landscape, breezing wind, photograph style www.crosshyou.info の続きです。前回は、R の infer パッケージを利用して、ANOVA(Analysis of Variance) 分析をしました。今回は、infer パッケージで Multiple Regres…

都道府県別の水質汚濁物排出量総合調査のデータ分析4 - R の infer で tidy な ANOVA(Analysis of Variance) 分析

Bing Image Creator で生成: Photo, landscape of higher mountains and great fall, a few flowers, white clouds, blue sky www.crosshyou.info の続きです。前回は箱ひげ図を作成して、生活環境項目 5 項目ごとのデータの分布を見ました。前々回はヒスト…

読書記録 - 「法とは何か 新版」 渡辺 洋三 著 (岩波新書)

法とは何か 新版 (岩波新書) 作者:渡辺 洋三 岩波書店 Amazon 旧版は 1979 年に出版され、この新版は 1998 年に出版されています。 新版とはいえ、四半世紀以上昔の本なので、現代の法律制度とは違っている部分があるので、その点は注意が必要かと思いました…

都道府県別の水質汚濁物質排出量総合調査のデータ分析3 - R で箱ひげ図を作成して、各生活環境項目別のデータを視覚化する

Bing Image Creatorで生成: Landscape, southern islands, green grass, white cloud, tiny flowers, photo www.crosshyou.info の続きです。前回は各年度別のヒストグラムを作成しました。年度によって大きな違いはなさそうでした。 今回は、five: 生活環境…

都道府県別の水質汚濁物質排出量総合調査のデータ分析2 - R でヒストグラムを作成して、各年度の分布を視覚化する

Bing Image Creatorで生成: Photo, Landscape in Summer season, quiet sense of wonder, hibiscus flowers www.crosshyou.info の続きです。 前回は各変数の度数や平均値などの統計量を調べました。 今回は変数のデータを視覚化してみます。 num: 事業場数…

都道府県別の水質汚濁物質排出量総合調査のデータ分析1- R に CSV ファイルのデータを読み込み、分析用のデータフレームを作成する。

Bing Image Creatorで生成: Photo, Spring Landscape, quiet flower garden今回は、都道府県別の水質汚濁物質排出量総合調査のデータを分析してみようと思います。政府統計の総合窓口(www.e-stat.go.jp)からデータを取得します。 こんな感じのデータです。 …

都道府県別の自動車(バス)輸送統計調査のデータ分析8 - R の princomp() 関数で主成分分析

Bing Image Generatorで生成: Photo, Winter snow field with red cameria www.crosshyou.info の続きです。 今回は、R で主成分分析をしてみようと思います。 Rによるデータサイエンス(第2版):データ解析の基礎から最新手法まで 作者:金 明哲 森北出版 Amaz…

読書記録 - 「化石に眠るDNA 絶滅動物は復活するか」 更科 功 著 (中公新書)

化石に眠るDNA 絶滅動物は復活するか (中公新書) 作者:更科功 中央公論新社 Amazon 自然界には生物の死骸や糞尿、汗などの由来の DNA がそこらじゅうにあるそうです。環境 DNA というらしいです。 なので、化石から DNA を取り出して分析するときは、それ…