www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2020-10-01から1ヶ月間の記事一覧

都道府県別の中二生徒のスポーツテストのデータ分析4 - R言語で散布図マトリックスを作成。psych::pairs.panles関数とGGally::ggpairs関数

www.crosshyou.info の続きです。 今回はR言語で散布図マトリックスを作成してみます。 まず、標準化したデータだけのデータフレームを用意します。 str関数でデータフレームの構造を確認します。 こんな感じです。標準化しているので、center とかscaleとい…

都道府県別の中二生徒のスポーツテストのデータ分析3 - 福井県が一番スポーツテストの成績が良い。

www.crosshyou.info の続きです。 今回は都道府県別の平均値を計算して、都道府県別のランキングを作成してみます。 まずは、group_by関数、summarise関数、mean関数を使います。 data_prefという名前で保存しました。 arrange関数でそれぞれの項目で並び替…

都道府県別の中二生徒のスポーツテストのデータ分析2 - R言語で平均値(mean関数)と標準偏差(sd関数)と変動係数を見る。

www.crosshyou.info の続きです。 前回はCSVファイルを読み込んだところで終わりました。今回はデータの中身をいろいろ見てみましょう。 summary関数でデータのサマリを見てみます。 NAの行が5つあります。 何でしょうか? 2007年度の北海道、群馬県、愛媛…

都道府県別の中二生徒のスポーツテストのデータ分析1 - R言語でデータを読み込む。

今回は都道府県別の中二生徒のスポーツテストのデータを分析してみます。 政府統計の総合窓口、e-Stat(www.e-stat.go.jp)からデータを取得しました。 50m走、ハンドボール投げ、立ち幅跳びの3種目です。 データのCSVファイルはこのようなものです。9行目に私…

農林水産物合計と上位20品目のデータ分析7 - R言語で回帰分析をする。layer()を使ってグラフを重ねてみる。

www.crosshyou.info の続きです。 今回は、R言語のlm関数で回帰分析をしてみます。 lm関数で、金額_対前年増減率 = a + b * 数量_対前年増減率 というモデル式で回帰分析をしてみました。p-value: 0.4226と0.05よりも大きな値なので、統計的に有意なモデルで…

農林水産物合計と上位20品目のデータ分析6 - R言語で散布図を作成する。

www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージのgeom_point関数を使って金額_対前年増減率と数量_対前年増減率の散布図を描いてみます。 まず、金額_対前年増減率のデータフレームを作りました。 同じように数量_対前年増減率のデータを…

農林水産物の輸出上位20品目のデータ分析5 - R言語で棒グラフを描く(geom_col関数)

www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージのgeom_col関数で棒グラフを描いてみます。 filter(type == "金額")で金額だけにデータフレームを絞り込みます。 mutate(hinmoku = reorder(hinmoku, valu)) でhinmokuをvalueの値で並び変え…

農林水産物の輸出上位20品目のデータ分析4 - データフレームの絞り込み(filter関数)や並び替え(arrange関数)

www.crosshyou.info の続きです。 今回はデータフレームの絞り込みや並び替えをします。 順位だけを表示します。 dplyrパッケージの中のfilter関数でtypeを順位だけにして、select関数でtype, value, hinmokuだけを表示しました。一番はアルコール飲料です。…

農林水産物の輸出上位20品目のデータ分析3 - R言語のinner_joinを使ってみる。

www.crosshyou.info の続きです。 前回は政府統計の総合窓口(e-Stat)のサイトのAPIでデータを取得してデータフレームを作成しました。作業の最後のところで、データのデータフレームと品目名、データタイプ名を結合するのにファクターのlevels関数で結合しま…

農林水産物の輸出上位20品目のデータ分析2 - R言語でAPIを使って政府統計の総合窓口(e-Stat)からデータを取得する。

www.crosshyou.info の続きです。 前回は政府統計の総合窓口(e-Stat)のサイトからファイルをダウンロードして、それをR言語のread.csvファイルを使って読み込みました。 今回は、APIを使って読み込んでみました。 www.dataquest.io https://www.dataquest.io…

農林水産物の輸出上位20品目のデータ分析1 - R言語のread.csv関数でCSVファイルの読み込み。

今回は、農林水産品輸出上位20品目のデータを分析します。 政府統計の総合窓口(e-Stat) www.e-stat.go.jp のサイトからデータを取得しました。 2020年10月9日に更新としてサイトのトップページにありましたので、これをクリックしました。 データベースと、…

都道府県別の1人当りの県民所得と従業者人数別事業所割合の分析5 - R言語のlm関数で回帰分析をする。

www.crosshyou.info の続きです。 今回はR言語のlm関数を使って回帰分析をしてみます。 rensponse variableはshotoku, explanatory variableはsmallでやってみます。 つまり、1人当りの県民所得を従業者人数が1~4人の事業所の割合で回帰するということです。…

都道府県別の1人当りの県民所得と従業者人数別事業所割合の分析4 - R言語のggplot2パッケージのgeom_point関数で散布図を作成

www.crosshyou.info の続きです。 今回は、R言語のggplot2パッケージのgeom_point関数で散布図を作成します。 まずは、shotokuとsmallの散布図です。 smallの割合が高いほど、shotokuは低くなるという相関ですね。 画面の左上にあるのは東京都です。 東京都…

都道府県別の1人当りの県民所得と従業者人数別事業所割合の分析3 - R言語でANOVA分析

www.crosshyou.info の続きです。 年度別のshotoku, small, largeを計算してみます。 R言語のgroup_by関数、select関数, summarise関数, mean関数, sd関数を使用しました。 group_by(year)でyear別にして、select(year, shotoku)でyearとshokotkuだけを抜き…