Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2024-01-01から1年間の記事一覧

読書記録 - 「「むなしさ」の味わい方」 きたやま おさむ 著 (岩波新書)

「むなしさ」の味わい方 (岩波新書) 作者:きたやま おさむ 岩波書店 Amazon 「むなしい」と感じることは誰でも経験する当たり前のことで、これを無理に埋めようとする必要はなくて、「むなしい」と感じている自分を見つめて、しばらく放っておくことがいいこ…

読書記録 - 「沈黙のセールスマン」 マイクル・Z・リューイン 著

沈黙のセールスマン〔新版〕 (ハヤカワ・ミステリ文庫) 作者:マイクル Z リューイン 早川書房 Amazon 1970年代のアメリカが舞台です。私立探偵のアルバート・サムスンが娘のサムと一緒に事件の謎を追うお話です。 アプローチしたい人の住所や連絡先を電話帳…

読書記録 - 「ウッドストック行最終バス」 コリン デクスター 著

ウッドストック行最終バス (ハヤカワ・ミステリ文庫 テ 4-1) 作者:コリン デクスター 早川書房 Amazon イギリスの推理小説で、モースとルイスという二人の刑事が、若い女性が惨殺された事件の捜査をする話です。 BS11という衛星放送で、「ルイス警部」という…

UCI Machine Learning Repository の Bike Sharing のデータの分析5 - Decision Tree Model による予測

Bing Image Creator で生成: Close up of gentiana scabra flowers, background is wild natural fields, photo www.crosshyou.info の続きです。 今回は、R の rpart パッケージを使って、決定木(Decision Tree) モデルで予測してみます。rpart パッケージ…

UCI Machine Learning Repository の Bike Sharing のデータの分析4 - k-Nearest Neighbors で予測する

Bing Image Creator で生成: Close up of Tulip flowers, background is blue sky and white clouds, photo www.crosshyou.info の続きです。 今回は、R の FNN パッケージを使って、k-Nearest Neighbors で予測してみます。 そうしたら、knn.reg() 関数を使…

UCI Machine Learning Repository の Bike Sharing のデータ分析3- 線形回帰モデルで予測する。

Bing Image Creator で生成: Close up of Paeonia suffruticosa flowers, background is Orion stars www.crosshyou.info の続きです。前回は、データフレームをトレーニング用とテスト用に分けました。それではいよいよモデルを作って予測してみましょう。 …

UCI Machine Learning Repository の Bike Sharing のデータの分析2 - R で予測をするための前処理をする

Bing Image Creator で生成: Close up of Wisteria of Flowers, background is natural green forests and blue sky, photo www.crosshyou.info の続きです。 前回は CSV ファイルのデータを R に読み込みました。今回はそのデータを予測しやすいように、デ…

読書記録 - 「日本史を暴く - 戦国の怪物から幕末の闇まで」 磯田 道史 著 (中公新書)

日本史を暴く-戦国の怪物から幕末の闇まで (中公新書 2729) 作者:磯田 道史 中央公論新社 Amazon 読売新聞に連載されていた記事を本にまとめたもので、一つ一つのお話は3,4ページぐらいで、5分ぐらいで読めました。 江戸時代にも感染症が流行して、その当…

UCI Machine Learning Repository の Bike Sharing のデータの分析1 - R で CSV ファイルのデータを読み込む

Bing Image Creator で生成: long bird's view of great rainforest river, photo 今回からしばらくは、UCI Machine Learning Repositry の Bike Sharing のデータを分析してみようと思います。 Fanaee-T, H. (2013). Bike Sharing [Dataset]. UCI Machine L…

東京都の大型小売店販売額のデータの分析4 - R で売上高の構成比率を分析

Bing Image Creator で生成: Close up of daisy flowers, ground is green grass, background is blue sky, photo www.crosshyou.info の続きです。 今回は百貨店とスーパーの売上品目の構成比率をみてみます。 上のようにして、構成比率を計算しました。 こ…

東京都の大型小売店販売額のデータの分析 3 - 百貨店とスーパーの違いがはっきりわかるRのバーチャート

Bing Image Creator で生成: Close up photograph of yellow Dandelion flowers, background is long wide view of blue sky and high mountains, photo www.crosshyou.info の続きです。 今回は、Rでバーチャートを描いて、百貨店とスーパーの違いがはっき…

東京都の大型小売店販売額のデータの分析2 - Rでラインチャートを描くと、百貨店の減少傾向、スーパーの増加傾向がはっきりとわかる。

Bing Image Creator で生成: close up photograph of white clover flowers. white flowers and pink flowers. www.crosshyou.info の続きです。 今回はデータをグラフにしてみます。 このデータは、2018年の1月から12月までと、2022年の1月から12月までの24…

東京都の大型小売店販売額のデータの分析1 - CSVファイルのデータをRに取り込む。

Bing Image Creator で生成: Close-up of Lotus Flower on the still lake surface, background is blue sky, rising sun, white clouds, photo 今回は、東京都の大型小売店販売額のデータを分析してみたいと思います。 https://www.toukei.metro.tokyo.lg.j…

読書記録 - 「幼児期 - 子どもは世界をどうつかむか」 岡本 夏木 著 (岩波新書)

幼児期―子どもは世界をどうつかむか (岩波新書 新赤版 949) 作者:岡本 夏木 岩波書店 Amazon 筆者の専攻は発達心理学とのことですが、読んでいて何か哲学書のような感じがしました。 生きるということは、「自己の実現」と「他者の関与」という相反する2つ…

2009年の東京都の駅の乗車人数のデータの分析7 - RでLogistinc RegressionとDecision Treeで判別分析(Classification)

Bing Image Creator で生成: wide photo shot of higher mountains, emerald green lakes, blue sky, photo www.crosshyou.info の続きです。今回はLogistic RegressionとDecision Treeで判別分析をしたいと思います。 まずは、glm()関数でLogistic Regressi…

2009年の東京都の駅の乗車人数のデータの分析6 - Rでk-Nearest NeighborsとNaive Bayesによる判別

Bing Image Creator で生成:close up photo of narcissus flowers, background is small lake, forests and blue sky, photo www.crosshyou.info 前回は判別分析(Classification)のためのトレーニング用のデータフレーム、テスト用のデータフレームを作成し…

読書記録 -「あなたの人生の物語」 テッド・チャン 著 (ハヤカワ文庫SF)

あなたの人生の物語 (ハヤカワ文庫SF) 作者:テッド・チャン 早川書房 Amazon 私にとって、久しぶりのSF小説の読書でした。とても面白かったです。 短編集で、「あなたの人生の物語」という作品の他に、 「バビロンの塔」「理解」「ゼロで割る」「七十二文字…

2009年の東京都の駅の乗車人数のデータの分析5 - Rで判別分析(Classification)をするためのデータの準備

Bing Image Creator で生成: Landscape of green grass fields, a few flowers, some white clouds in the blue sky, photo www.crosshyou.info の続きです。今回からは、Rで判別分析(Classification)をしてみようと思います。 まず、路線ごとの平均乗車人数…

読書記録 - 「インド - グローバル・サウスの超大国」 近藤 正規 著 (中公新書)

インド―グローバル・サウスの超大国 (中公新書) 作者:近藤正規 中央公論新社 Amazon インドは人口は現在は世界一だそうです。GDPは、アメリカ、中国、ドイツ、日本、の次の5位だそうです。 これからも発展をしていきそうなことがわかりました。 インドは南部…

2009年の東京都の駅の乗車人数のデータの分析4 - inferパッケージを利用して、平均値の差の検定(t 検定)

Bing Image Creator で生成: Landscape photography, natural green field, blue wide sky, flying a butterfly www.crosshyou.info の続きです。 前回の分析(のようなもの)で、山手線と東海道線の駅が乗車人数の平均値の上位2路線だとわかりました。今回は…

2009年の東京都の駅の乗車人数のデータの分析3 - group_by()関数とsummarize()関数で路線別のデータ

Bing Image Creator で生成: Landscape of Phalaenopsis orchid garden, blue sky background, photo www.crosshyou.info の続きです。 今回は、group_by()関数とsummarize()関数を使って路線ごとのデータを見てみます。 中央線が30駅、青梅線が24駅、山手線…

2009年の東京都のJR駅の乗車人数のデータの分析2 - arrange()関数でデータフレームを並び替え

Bing Image Creator で生成: Long view landscape, full of wild flowers field, photo www.crosshyou.info の続きです。 今回は、arrange()関数でデータの並び替えをします。 まず、一番total(トータルの乗車人数)の多い駅はどこでしょうか? 新宿駅が一番…

2009年の東京都のJR駅の乗車人数のデータの分析1- CSVファイルのデータをRにインポートする。

Bing Image Creator で生成: Graceful camellia sasanqua garden, photo 東京都のウェブサイトから2009年の東京都にあるJRの駅の乗車人数のCSVファイルをダウンロードしました。 東京都統計年鑑 東京都統計年鑑 平成21年 運輸|東京都の統計 このようなファ…

Kaggle's Gym Members Exercise Dataset Analysis with R 6 - Logistic Regression and Decision Tree to see Male or Female.

Generated by Bing Image Creator: Long-wide landscape view of large fall and river, flowering dandelions, photo www.crosshyou.info This post is follwong of the above post. In this post, I will to classification practice, to see Male or Fema…

Kaggle's Gym Members Exercise Dataset Analysis with R 5 - Linear Regression and Tree Model Regression to Forecast Calories

Generated by Bing Image Creator: Long landscape view of photograph, wind breezing grass field under the blue sky www.crosshyou.info This post is following of the above post. This morning, I will do linear regression and tree model regressi…

Kaggle's Gym Members Exercise Dataset Analysis with R 4 - Statistical Inference with infer package: 2-Sample mean t-Test

Generated by Bing Image Creator: Light blue forest landscape, yellow and green flowers, photowww.crosshyou.info This post is following of the above post. In this post, I will do statistical inference with infer package. I refere to Tidy St…

Kaggle's Gym Members Exercise Dataset Analysis with R 3 - Visualizing Gym Data Part II

Generated by Bing Image Creator: last sunshine landscape of Morocco blue sky, photo www.crosshyou.info This post is following of the above post.In the above post, I make grapsh to see variables. In this post I add gender data to those grap…

Kaggle's Gym Members Exercise Dataset Analysis with R 2 - Visualizing Gym Data

Generated by Bing Image Creator: wine red colored kochia field under blue sky and white cloud, fine photo www.crosshyou.info This post is following of above post. In the above post, I imported Kaggle's Gym Members Exercise Dataset into R. …

読書記録 - 「耳は悩んでいる」小島 博己 編著 (岩波新書)

耳は悩んでいる (岩波新書 新赤版 2000) 岩波書店 Amazon 小島先生は慈恵医科大学の耳鼻咽喉科のお医者さんで、その他の耳鼻咽喉科の先生たちが、各章を担当して書いた本です。 一番印象に残ったのは、耳が聞こえにくくなると、認知症にかかりやすくなる、と…

Kaggle's Gym Members Exercise Dataset Analysis with R 1 - Import CSV file.

Generated by Bing Image Creator: far away landscape, white mountains, green fields, blue sky, photo In this post, I will do some data analysis for Kaggle's "Gym Memners Exercise Dataset" It is in Gym Members Exercise Dataset, or https://ww…