Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2022-01-01から1ヶ月間の記事一覧

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析5 - Rのlm()関数で重回帰分析をする。はり・きゅう師の人数が増えると、あんま・マッサージ師の数も増える。

Photo by Kazden Cattapan on Unsplash www.crosshyou.info の続きです。前回はあんま・マッサージ師の変化幅をはり・きゅう師の変化幅で説明する単回帰モデルを分析しました。 R-squaredが0.4513ですので、あんま・マッサージ師の変化幅をはり・きゅう師の…

RのHistDataパッケージのCavendish

Photo by Marina Kraus on Unsplash RのHIstDataパッケージのCavendishのデータは、イギリスの科学者のヘンリー・キャベンディッシュの1798年に行った地球の密度の測定に関する実験のデータです。 Wikipediaによると、 ヘンリー・キャヴェンディッシュ - Wik…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析4 - Rのlm()関数で単回帰分析をする。broomパッケージやlmtestパッケージも使用。

Photo by olena ivanova on Unsplash www.crosshyou.info の続きです。 前回の分析では、人口当たりのあんま・マッサージ師の数が大きく増えているところもあれば、大きく減少しているところもありました。 そこで、この人口当たりのあんま・マッサージ師の…

読書記録 - 「南極の氷に何が起きているか - 気候変動と氷床の科学」杉山 慎 著 中公新書

南極の氷に何が起きているか-気候変動と氷床の科学 (中公新書, 2672) 作者:杉山 慎 中央公論新社 Amazon 南極にある氷は、地球にある淡水の大部分だそうです。 そして、その氷が地球温暖化の影響で融けて少なくなってきているそうです。 ただ、南極の氷全体…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析3 - 1975年のデータと2018年のデータの比較。

Photo by Dawid Zawiła on Unsplash www.crosshyou.info の続きです。 2018年のデータフレームと1975年のデータフレームを合体させましょう。 まず、上のようにして、df_1975、df_2019のそれぞれのデータフレームから必要な変数だけを抜き出しました。今回は…

RのHistDataパッケージのBowley

Photo by Greg Rosenke on Unsplash HistDataパッケージのBowleyデータをみてみます。 これは、一番初めに書かれた統計の教科書の一つ、Arthur Bowley(1901)のなかで使われているデータで、イギリスとアイルランドの輸出データの時系列データです。 Arthur B…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析2 - 人口当たりの数の散布図をplot()関数で描く。

Photo by Federico Di Dio photography on Unsplash www.crosshyou.info の続きです。 2018年だけのデータフレームを作成します。 このデータフレームを使って、anmassage_pop, harikyu_pop, judo_popの相関関係をみてみます。これらは順番に人口100万人当た…

都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータの分析1 - 人口当たりでは、大阪がはり・きゅう師、柔道整復師数が一番多い。

Photo by Alex Machado on Unsplash 今回は都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータを分析してみようと思います。 まず、政府統計の総合窓口、e-stat.go.jpからデータをダウンロードします。 47の都道府県を選択し、 総人口…

RのHistDataパッケージのArmada

Photo by Peter Pryharski on Unsplash RのHistDataパッケージのArmadaデータセットはスペインの無敵艦隊のデータです。 str()関数でデータ構造を見ると、10行 x 11列のデータフレームです。 それぞれの変数が何かというと、 Armada: designation of the fle…

都道府県別のNHKのコロナ感染者データの分析3 - 全都道府県のコロナでの死亡、コロナ感染、致死率のオッズ比とリスク比を算出する。

Photo by Andre Benz on Unsplash www.crosshyou.info の続きです。前回は大阪のコロナでの死亡やコロナ感染、コロナの致死率などのオッズ比、リスク比を算出しました。 今回は全都道府県のオッズ比、リスク比を算出しましょう。 まず、計算に必要なデータを…

都道府県別のNHKのコロナ感染者データの分析2 - 大阪のコロナでの死亡、コロナ感染、コロナ致死率のリスク比を計算する。

Photo by Francisco Moreno on Unsplash www.crosshyou.info の続きです。 大阪の人口当たりのコロナ死亡者数はダントツに多いことがわかりました。 それでは、コロナ感染者数はどうでしょうか? まずはグラフを描いてみます。 一番多いのは沖縄、2番目は東…

都道府県別のNHKのコロナ感染者データの分析1 - 大阪の人口当たりのコロナ死亡者数はダントツに多い。

Photo by Hans Isaacson on Unsplash 今日(2022-01-08)、図書館に行って週刊誌「サンデー毎日」をパラパラと紙面をめくって眺め読みしていたら、大阪府の人口当たりのコロナ死者数がダントツに高い、という記事が目に入りました。そこで、今回はNHKのデータ…

RのHistDataパッケージのArbuthnot

更新日:2022-01-08 Photo by Annie Spratt on Unsplash Rのパッケージで、HistDataというパッケージがあります。これは統計学の世界やビジュアライゼーションの分野で使われた面白い小さなデータセットを集めたパッケージです。このヘルプ文書にいろいろと…

OECD Purchasing power parities (PPP) data analysis 6 - Time-Series Analysis using R. Static Time Series Model

Photo by Sora Sagano on Unsplash www.crosshyou.info This post is following of the above post. In this post, I will do time-series analysis. I use JPN data only. Firstly, I make JPN only dataframe. Then, let's see statistical summary of df_…

OECD Purchasing power parities (PPP) data analysis 5 - PCA (Principal Component Analysis) using R.

Photo by Aron Visuals on Unsplash www.crosshyou.info This post is following of the above post.In this post, I will do PCA(Principal Component Analysis). I refer below web site.Principal Component Analysis (PCA) 101, using R | by Peter Nist…