2021-05-01から1ヶ月間の記事一覧
www.crosshyou.info の続きです。 今回は自民党議員の比率をみてみます。 まず、mutate関数で自民党議員の比率の変数: jimin_ratioを作りました。 早速比率の高い都道府県をみてみましょう。 富山県が80%で一番高い比率です。熊本県、鹿児島県、香川県と続き…
www.crosshyou.info の続きです。 前回の分析で全国の女性議員比率はわずか11%だとわかりました。 今回は具体的にどの都道府県が女性議員比率が高いのか、低いのかをみていきましょう。 まずはじめにmutate関数で女性議員比率を表す変数: f_ratioを作成しま…
www.crosshyou.info の続きです。 まず、どの政党の議員が多いのか少ないのか、colSums関数で各変数の合計値を見てみましょう。 m_jimin: 男性の自民党が1237人で一番多いようですね。わかりやすいようにグラフにしてみます。 m_jimin: 男性の自民党、m_mush…
今回は都道府県別の県議会議員の所属政党のデータの分析をしてみようと思います。 政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードしました。 新着となっているところをクリックしたところ、下の画像のようになります。 所属党員別人員調(R2.…
This blog is following of www.crosshyou.info In this blog, I will show you how to get confidence interval with bootstrap method. for BIRD, 95% confidence interval is 18.1 ~ 25.3 by parametric calculation. average ± qt(0.975, d.f.)*S.E. We …
This blog is following of www.crosshyou.info In this blofg, I will make barplot with error bars. 1. check n(number of overbations) of each SUBJECT We see BIRD has 36, MAMAL has 34 and PLANT has 35 observations. 2. calculate average pf each…
www.crosshyou.info In this brlog, let's do ANOVA(Analysis of Variance). We see average Value(percentage of threatened species) are different by SUBJECT. BIRD has the highest Value and PLANT has the lowest.But this difference is statistical…
www.crosshyou.info This brlog is following of above blog.This time, let's visualize data with ggplot2 package in R. Boxplot by SUBJECT We see BIRD are the highest median and PLANT is the lowest median. Next, let's visualize by LOCATION CZE…
Hello. In this blog, I will analyize OECD Threatend species data.First, I goet data from OECD web site. Biodiversity - Threatened species - OECD DataThe csv file looks below Let's read this file into R. First of all, load tidyverse pachage…
www.crosshyou.info の続きです。 前回はper_shobun: 食品営業施設当たりの処分件数をshishutsu: 消費支出で回帰分析しました。 今回はさらに変数を加えて回帰分析をしたいと思います。 はじめに、都道府県ごとの平均値のデータフレームを作りました。 この…
www.crosshyou.info の続きです。 今回はR言語のlm関数を使って、単回帰分析と多項式線形回帰分析をしてみます。 まずは、変数同士の散布図をみてみます。 相関係数マトリックスもみてみます。 per_shobun: 食品営業施設当たりの処分件数と一番相関の強いの…
www.crosshyou.info の続きです。 前回のグラフで、最近のほうが食品営業施設当たりの処分件数はバラツキが小さく、件数も低いことがわかりました。 そのことを検定してみましょう。 1975年から1980年までの6年間のper_shobun: 食品営業施設当たりの処分件数…
花粉症と人類 (岩波新書 新赤版 1869) 作者:小塩 海平 発売日: 2021/02/22 メディア: 新書 花粉症は文明病というか人類が自然を乱開発して自然のバランスを崩した結果だと言える。 日本はスギ花粉症、アメリカはブタクサ花粉症、ヨーロッパはバラの花粉症な…
www.crosshyou.info の続きです。 per_shobun: 食品営業施設当たりの処分件数のサマリを見てみます。 最小値は0、最大値は14.61、中央値は0.198、平均値は0.463です。 最大値の14.61は異常に大きいですよね。。 何年のどこの都道府県なのか確認しましょう。 …
www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージでグラフをいくつか描いてみます。 まず、geom_histogram関数でヒストグラムを描きます。 一部、大きな数のデータがありますね。X軸を対数目盛にしてみます。 scale_x_log10()を加えると、X…
今回は都道府県別の食品営業施設処分件数の分析をします。 まず、政府統計の総合窓口(www.e-stat.go.jp)からデータをダウンロードします。 47都道府県を選択します。 総人口(人)、食品営業施設数(所)、食品営業施設処分件数(件)、消費支出(全世帯)(円)を選択…
www.crosshyou.info の続きです。 今回はR言語のsvm関数でSupport Vector Machine Regressionをしてみます。 まず、e1071パッケージの読み込みをします。 svm関数でモデルを作ります。 summary関数で結果をみてみます。 あんまりよくわからない出力ですが、…
www.crosshyou.info の続きです。 今回はR言語のrpart関数でregression tree分析をしてみます。 まず、rpartパッケージの読み込みをします。 rpart関数でregression treeモデルを作成します。 plot関数とtext関数で結果を見てみます。 決定木のグラフは左がY…
www.crosshyou.info の続きです。 今回はRidge Regressionをしてみます。 Regression Analysis with R: Design and develop statistical nodes to identify unique relationships within data at scale 作者:Ciaburro, Giuseppe 発売日: 2018/01/31 メディア…
www.crosshyou.info の続きです。 前回作成したデータフレーム、df0108: 2008年と2001年の差分のデータを使って分析していきます。 diff_goraku: 消費者物価指数・教養娯楽のデータの変化幅の大きいところ、小さいところはどこでしょうか?R言語のarrange関…
www.crosshyou.info の続きです。 2001年と2008年のgoraku: 消費者物価指数・教養娯楽の比較をしてみます。 どこの都道府県が大きく変化したのでしょうか? 2001年のデータフレームを作ります。 同様に2008年だけのデータフレームを作ります。 inner_join関…
入門 人間の安全保障 増補版-恐怖と欠乏からの自由を求めて (中公新書 2195) 作者:長 有紀枝 発売日: 2021/01/18 メディア: 新書 人間の安全保障となんだろうか? 曖昧な概念だか、恐怖や欠乏から逃れたい、逃れる権利がある、ということかなと感じた。国や…
www.crosshyou.info の続きです。 今回はいろいろなグラフを作ってみます。 まずは、goraku: 消費者物価指数・教養娯楽とyear: 調査年のグラフです。R言語のplot関数で簡単に作成できます。 2005年が基準年なので、どの都道府県も100です。全体に年を追うご…