2020-10-01から1ヶ月間の記事一覧
www.crosshyou.info の続きです。 今回はR言語で散布図マトリックスを作成してみます。 まず、標準化したデータだけのデータフレームを用意します。 str関数でデータフレームの構造を確認します。 こんな感じです。標準化しているので、center とかscaleとい…
www.crosshyou.info の続きです。 今回は都道府県別の平均値を計算して、都道府県別のランキングを作成してみます。 まずは、group_by関数、summarise関数、mean関数を使います。 data_prefという名前で保存しました。 arrange関数でそれぞれの項目で並び替…
www.crosshyou.info の続きです。 前回はCSVファイルを読み込んだところで終わりました。今回はデータの中身をいろいろ見てみましょう。 summary関数でデータのサマリを見てみます。 NAの行が5つあります。 何でしょうか? 2007年度の北海道、群馬県、愛媛…
今回は都道府県別の中二生徒のスポーツテストのデータを分析してみます。 政府統計の総合窓口、e-Stat(www.e-stat.go.jp)からデータを取得しました。 50m走、ハンドボール投げ、立ち幅跳びの3種目です。 データのCSVファイルはこのようなものです。9行目に私…
www.crosshyou.info の続きです。 今回は、R言語のlm関数で回帰分析をしてみます。 lm関数で、金額_対前年増減率 = a + b * 数量_対前年増減率 というモデル式で回帰分析をしてみました。p-value: 0.4226と0.05よりも大きな値なので、統計的に有意なモデルで…
www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージのgeom_point関数を使って金額_対前年増減率と数量_対前年増減率の散布図を描いてみます。 まず、金額_対前年増減率のデータフレームを作りました。 同じように数量_対前年増減率のデータを…
www.crosshyou.info の続きです。 今回はR言語のggplot2パッケージのgeom_col関数で棒グラフを描いてみます。 filter(type == "金額")で金額だけにデータフレームを絞り込みます。 mutate(hinmoku = reorder(hinmoku, valu)) でhinmokuをvalueの値で並び変え…
www.crosshyou.info の続きです。 今回はデータフレームの絞り込みや並び替えをします。 順位だけを表示します。 dplyrパッケージの中のfilter関数でtypeを順位だけにして、select関数でtype, value, hinmokuだけを表示しました。一番はアルコール飲料です。…
www.crosshyou.info の続きです。 前回は政府統計の総合窓口(e-Stat)のサイトのAPIでデータを取得してデータフレームを作成しました。作業の最後のところで、データのデータフレームと品目名、データタイプ名を結合するのにファクターのlevels関数で結合しま…
www.crosshyou.info の続きです。 前回は政府統計の総合窓口(e-Stat)のサイトからファイルをダウンロードして、それをR言語のread.csvファイルを使って読み込みました。 今回は、APIを使って読み込んでみました。 www.dataquest.io https://www.dataquest.io…
今回は、農林水産品輸出上位20品目のデータを分析します。 政府統計の総合窓口(e-Stat) www.e-stat.go.jp のサイトからデータを取得しました。 2020年10月9日に更新としてサイトのトップページにありましたので、これをクリックしました。 データベースと、…
www.crosshyou.info の続きです。 今回はR言語のlm関数を使って回帰分析をしてみます。 rensponse variableはshotoku, explanatory variableはsmallでやってみます。 つまり、1人当りの県民所得を従業者人数が1~4人の事業所の割合で回帰するということです。…
www.crosshyou.info の続きです。 今回は、R言語のggplot2パッケージのgeom_point関数で散布図を作成します。 まずは、shotokuとsmallの散布図です。 smallの割合が高いほど、shotokuは低くなるという相関ですね。 画面の左上にあるのは東京都です。 東京都…
www.crosshyou.info の続きです。 年度別のshotoku, small, largeを計算してみます。 R言語のgroup_by関数、select関数, summarise関数, mean関数, sd関数を使用しました。 group_by(year)でyear別にして、select(year, shotoku)でyearとshokotkuだけを抜き…