Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2021-05-01から1ヶ月間の記事一覧

都道府県別の県議会議員の所属政党のデータの分析4 - 自民党議員の比率の高い都道府県・低い都道府県。大阪府は特別に低い。

www.crosshyou.info の続きです。 今回は自民党議員の比率をみてみます。 まず、mutate関数で自民党議員の比率の変数: jimin_ratioを作りました。 早速比率の高い都道府県をみてみましょう。 富山県が80%で一番高い比率です。熊本県、鹿児島県、香川県と続き…

都道府県別の県議会議員の所属政党のデータの分析3 - 女性議員比率の高い都道府県、低い都道府県はどこか。東京都の女性議員比率は特別高い。

www.crosshyou.info の続きです。 前回の分析で全国の女性議員比率はわずか11%だとわかりました。 今回は具体的にどの都道府県が女性議員比率が高いのか、低いのかをみていきましょう。 まずはじめにmutate関数で女性議員比率を表す変数: f_ratioを作成しま…

都道府県別の県議会議員の所属政党のデータの分析2 - 女性議員比率は全国合計でわずか11%

www.crosshyou.info の続きです。 まず、どの政党の議員が多いのか少ないのか、colSums関数で各変数の合計値を見てみましょう。 m_jimin: 男性の自民党が1237人で一番多いようですね。わかりやすいようにグラフにしてみます。 m_jimin: 男性の自民党、m_mush…

都道府県別の県議会議員の所属政党のデータの分析1 - R言語のread.csv関数でデータを読み込む。

今回は都道府県別の県議会議員の所属政党のデータの分析をしてみようと思います。 政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードしました。 新着となっているところをクリックしたところ、下の画像のようになります。 所属党員別人員調(R2.…

OECD Threatened species data analysis 5 - Bootstrap for Cinfidence Interval

This blog is following of www.crosshyou.info In this blog, I will show you how to get confidence interval with bootstrap method. for BIRD, 95% confidence interval is 18.1 ~ 25.3 by parametric calculation. average ± qt(0.975, d.f.)*S.E. We …

OECD Threatened species data analysis 4 - making bar plot with error bars in R

This blog is following of www.crosshyou.info In this blofg, I will make barplot with error bars. 1. check n(number of overbations) of each SUBJECT We see BIRD has 36, MAMAL has 34 and PLANT has 35 observations. 2. calculate average pf each…

OECD Threatened species data analysis 3 - ANOVA(ANalysis Of VAriance) without lm() and anova()

www.crosshyou.info In this brlog, let's do ANOVA(Analysis of Variance). We see average Value(percentage of threatened species) are different by SUBJECT. BIRD has the highest Value and PLANT has the lowest.But this difference is statistical…

OECD Threatened species data analysis 2 - visualize data using ggplot2 in R

www.crosshyou.info This brlog is following of above blog.This time, let's visualize data with ggplot2 package in R. Boxplot by SUBJECT We see BIRD are the highest median and PLANT is the lowest median. Next, let's visualize by LOCATION CZE…

OECD Threatened species data analysis 1 - read csv file into R

Hello. In this blog, I will analyize OECD Threatend species data.First, I goet data from OECD web site. Biodiversity - Threatened species - OECD DataThe csv file looks below Let's read this file into R. First of all, load tidyverse pachage…

都道府県別の食品営業施設処分件数のデータの分析6 - R言語で重回帰分析をしたが、どの説明変数も有意ではなく結局、平均値が一番となった。

www.crosshyou.info の続きです。 前回はper_shobun: 食品営業施設当たりの処分件数をshishutsu: 消費支出で回帰分析しました。 今回はさらに変数を加えて回帰分析をしたいと思います。 はじめに、都道府県ごとの平均値のデータフレームを作りました。 この…

都道府県別の食品営業施設処分件数のデータの分析5 - R言語で単回帰分析と多項式線形回帰分析をする

www.crosshyou.info の続きです。 今回はR言語のlm関数を使って、単回帰分析と多項式線形回帰分析をしてみます。 まずは、変数同士の散布図をみてみます。 相関係数マトリックスもみてみます。 per_shobun: 食品営業施設当たりの処分件数と一番相関の強いの…

都道府県別の食品営業施設処分件数のデータの分析4 - 昔のほうが処分件数はあきらかに多かった。

www.crosshyou.info の続きです。 前回のグラフで、最近のほうが食品営業施設当たりの処分件数はバラツキが小さく、件数も低いことがわかりました。 そのことを検定してみましょう。 1975年から1980年までの6年間のper_shobun: 食品営業施設当たりの処分件数…

読書記録 - 「花粉症と人類」 小塩海平 著 (岩波新書)

花粉症と人類 (岩波新書 新赤版 1869) 作者:小塩 海平 発売日: 2021/02/22 メディア: 新書 花粉症は文明病というか人類が自然を乱開発して自然のバランスを崩した結果だと言える。 日本はスギ花粉症、アメリカはブタクサ花粉症、ヨーロッパはバラの花粉症な…

都道府県別の食品営業施設処分件数のデータの分析3 - 1977年の長野県は処分件数が異常に多かった。

www.crosshyou.info の続きです。 per_shobun: 食品営業施設当たりの処分件数のサマリを見てみます。 最小値は0、最大値は14.61、中央値は0.198、平均値は0.463です。 最大値の14.61は異常に大きいですよね。。 何年のどこの都道府県なのか確認しましょう。 …

都道府県別の食品営業施設処分件数のデータの分析2 - R言語のgeom_histogram関数でヒストグラムを描く。

www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージでグラフをいくつか描いてみます。 まず、geom_histogram関数でヒストグラムを描きます。 一部、大きな数のデータがありますね。X軸を対数目盛にしてみます。 scale_x_log10()を加えると、X…

都道府県別の食品営業施設処分件数のデータの分析1- R言語のread_csv関数でデータを読み込む。

今回は都道府県別の食品営業施設処分件数の分析をします。 まず、政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードします。 47都道府県を選択します。 総人口(人)、食品営業施設数(所)、食品営業施設処分件数(件)、消費支出(全世帯)(円)を選択…

都道府県別の消費者物価指数・教養娯楽のデータの分析8 - R言語のsvm関数でSupport Vector Machine Regressionをする。

www.crosshyou.info の続きです。 今回はR言語のsvm関数でSupport Vector Machine Regressionをしてみます。 まず、e1071パッケージの読み込みをします。 svm関数でモデルを作ります。 summary関数で結果をみてみます。 あんまりよくわからない出力ですが、…

都道府県別の消費者物価指数・教養娯楽のデータの分析7- R言語のrpart関数でRegression Tree(決定木分析)をする

www.crosshyou.info の続きです。 今回はR言語のrpart関数でregression tree分析をしてみます。 まず、rpartパッケージの読み込みをします。 rpart関数でregression treeモデルを作成します。 plot関数とtext関数で結果を見てみます。 決定木のグラフは左がY…

都道府県別の消費者物価指数・教養娯楽のデータの分析6 - R言語でRidge Regressionをする

www.crosshyou.info の続きです。 今回はRidge Regressionをしてみます。 Regression Analysis with R: Design and develop statistical nodes to identify unique relationships within data at scale 作者:Ciaburro, Giuseppe 発売日: 2018/01/31 メディア…

都道府県別の消費者物価指数・教養娯楽のデータの分析5- R言語のlm関数で回帰分析をする。

www.crosshyou.info の続きです。 前回作成したデータフレーム、df0108: 2008年と2001年の差分のデータを使って分析していきます。 diff_goraku: 消費者物価指数・教養娯楽のデータの変化幅の大きいところ、小さいところはどこでしょうか?R言語のarrange関…

都道府県別の消費者物価指数・教養娯楽のデータの分析4 - R言語のhist関数でヒストグラムと度数分布表を作る。

www.crosshyou.info の続きです。 2001年と2008年のgoraku: 消費者物価指数・教養娯楽の比較をしてみます。 どこの都道府県が大きく変化したのでしょうか? 2001年のデータフレームを作ります。 同様に2008年だけのデータフレームを作ります。 inner_join関…

読書記録 - 「入門 人間の安全保障 - 恐怖と欠乏からの自由を求めて」長有紀枝 著 (中公新書)

入門 人間の安全保障 増補版-恐怖と欠乏からの自由を求めて (中公新書 2195) 作者:長 有紀枝 発売日: 2021/01/18 メディア: 新書 人間の安全保障となんだろうか? 曖昧な概念だか、恐怖や欠乏から逃れたい、逃れる権利がある、ということかなと感じた。国や…

都道府県別の消費者物価指数・教養娯楽のデータの分析3 - R言語のplot関数でグラフを描く。教養娯楽の物価指数は低下傾向。

www.crosshyou.info の続きです。 今回はいろいろなグラフを作ってみます。 まずは、goraku: 消費者物価指数・教養娯楽とyear: 調査年のグラフです。R言語のplot関数で簡単に作成できます。 2005年が基準年なので、どの都道府県も100です。全体に年を追うご…