Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2018-08-01から1ヶ月間の記事一覧

青果物卸売市場調査の分析5 - 産地によって、なすの価格に違いはあるのか?(wilcox.test関数) 茨城は安く、群馬は高い

今回の分析では、7月の青果物卸売市場調査のデータを使って、産地によって同じ野菜でも価格に違いがあるかどうか?を分析しようと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数でデータの要約統計量を表示…

青果物卸売市場調査の分析4 - キャベツ、レタス、はくさいの出荷数量の多い産地は?(tapply関数とsum関数、order関数)。長野、おそるべし。。

今回も青果物卸売市場調査の7月のデータを使います。前回の分析で、出荷量が多い野菜は、キャベツ、レタス、はくさいがトップ3でした。今回は、この3品目に注目してみたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数で読込み、sum…

青果物卸売市場調査の分析3 - 7月に一番数量が出た野菜は何か?一番数量が出た産地はどこか?(tapply関数とsum関数、order関数)

今回は青果物卸売市場調査のデータを使って、7月に一番数量の出た野菜は何かを調べたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数を使って読込み、summary関数を使ってデータの要約を表示しましょう。 品目名の列名のところを見る…

青果物卸売市場調査の分析2 - 7月の野菜の価格は上昇トレンドでした。(plot関数, barplot関数, stem関数)

今回は、青果物卸売市場調査のデータを使って、7月の野菜価格の推移を見てみようと思います。 まずは、CSVファイルに保存してあるデータをR言語にread.csv関数を使って読み込ませます。 品目名にはどんなものがあるか、度数の多い順に並び替えて表示します…

青果物卸売市場調査の分析1 - 基本統計量(summary関数, table関数, sd関数)

いつものように、政府統計の総合窓口のサイト、e-Statを訪問したら、新着データで、「青果物卸売市場調査」というデータが新着でありました。 クリックしてみました。 本調査は、青果物卸売市場の取引状況を調査し、野菜50品目、果物44品目・品種別の日別・…

建設総合統計の分析5 - 増減と地域でクロス表集計(table関数, fisher.test関数)。フィッシャーの直接確率検定

今回は前回に引き続き、建設総合統計でクロス表分析です。 前回は発注者と増減でクロス集計しましたので、今回は地域と増減でクロス集計です。 まずは、 csvファイルに保存してあるデータをread.csv関数で読込み 増減を計算し(ベクトルの引き算) 増減のカテ…

建設総合統計の分析4 - 前月からの増減を増加・減少のカテゴリカル変数にしてクロス表分析(chisq.test)

今回は、建設総合統計分析の前月からの増減を増加・減少のカテゴリカル変数にして、クロス表を作成し、カイ自乗検定をしようと思います。 まずは、csvファイルに保存してあるデータをread.csv関数でR言語に読込みます。 4月から5月の変化と、5月から6月…

建設総合統計の分析3 - 月によって発注者の割合に違いはあるか?カイ自乗検定で分析(chisq.test)

前回の分析では、地域によって発注者の割合に違いがあることがわかりました。今回は月によって、具体的には、4月、5月、6月で発注者の割合に違いがあるのかをみてみようと思います。 まずは、データをread.csv関数でR言語に読込ませます。 4月の建設出来高を…

建設総合統計の分析2 - 地域によって発注者の割合に違いはあるか?カイ自乗検定で検証(chisq.test関数)

今回は建設総合統計のデータを使って、地域 x 発注者のクロス表を作成して地域によって発注者の割合に違いがあるかを見てみましょう。 まずは、データをread.csv関数で読込みます。 発注者は、その他、公団・独法・政府企業等、国、市区町村、地方公営企業、…

建設総合統計の分析1 - 基本統計量(summary関数, apply関数, sd関数, mean関数, median関数)

今回は、建設総合統計の分析です。 いつものようにe-Stat(政府統計の総合窓口)を訪問したら、新着データがありました。 建設総合統計は、国内の建設活動を出来高ベースで把握することを目的とした加工統計です。建築着工統計調査及び建設工事受注動態調査か…

牛乳乳製品の生産動向分析8 - 昭和60年と平成29年の主要乳製品の生産量比率の違いを検定

前回の分析で、主要乳製品の生産量の割合は昭和60年と平成29年でかなり違っていることがわかりました。今回はこの2つの年のデータを比較して、割合が有意に違っているのかどうかを検定してみます。 まずは、csvファイルに保存してあるデータをread.csv関数で…

牛乳乳製品の生産動向分析7 - 主要乳製品の生産量の割合(as.matrix関数, prop.table関数, as.data.frame関数)

今回は、主要乳製品の生産量の割合を見てみようと思います。平成〇〇年は脱脂粉乳は20%でチーズは25%だった。。というような割合です。 まずはcsvファイルに保存してあるデータをread.csv関数でR言語に読込ませます。 生産量のデータだけのデータフレームを…

牛乳乳製品の生産動向分析6 - 主要乳製品の伸び率をヒストグラムにする。(hist関数)

前回は、主要乳製品の伸び率を棒グラフで表示してみましたが、いまひとつ傾向がわかりませんでした。そこで今回はヒストグラムにしてみようと思います。 まずは、csvファイルにあるデータを読込みます。 伸び率のデータは、3, 5, 7, 9, 11, 13, 15, 17列にあ…

牛乳乳製品の生産動向分析5 - 主要乳製品の伸び率を棒グラフにする。(barplot関数)

前回は、主要乳製品の生産量をグラフにしました。今回は、伸び率をグラフにしようと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読み込みます。 伸び率だけのデータフレームを作成します。 伸び率は、3列目から17列目までの奇数列に…

牛乳乳製品の生産動向分析4 - 主要乳製品の生産量の推移をグラフにする。(plot関数)

今回は、主要乳製品の生産量の推移をグラフにしてみたいと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読込みます。 バターの推移をグラフにしてみます。plot関数です。 plot(データ)でグラフになりますが、このように何もオプショ…

牛乳乳製品の生産動向分析3 - 主要乳製品を因子分析(factanal関数)

今回は前回に引き続き、牛乳乳製品生産動向のデータの主要乳製品の生産量を因子分析したいと思います。 前回までのR言語のコマンドを書くと以下のようになります。 # 牛乳乳製品生産動向 主要乳製品生産量milk <- read.csv("milk.csv")head(milk) # 生産量だ…

牛乳乳製品の生産動向分析2 - 主要乳製品の相関関係を見る(cor関数)

今回は主要乳製品の相関関係を見てみます。 まずは、csvファイルにあるデータをread.csv関数でR言語に読込みます。 このように、各製品の生産量(トン、アイスクリームはキロリットル)と前年伸び率(パーセント)のデータです。 バター、脱脂粉乳、れん乳類、全…

牛乳乳製品の生産動向分析1 - 主要乳製品生産量の基本統計量(summary関数, apply関数とsd関数)

政府統計の総合窓口、e-Statのサイトに訪問をしたら、牛乳乳製品の生産動向という統計が新着でありました。 乳製品好きとしては、チェックしないではいられません。早速ファイルを見てみます。 本統計では、全国の生乳生産量、用途別処理量、地域別生乳生産…

鉱工業出荷内訳表の分析8 - 月によって、輸出 / 国内 の比率に違いはあるか?

前回は、鉱工業出荷内訳表のデータを使って、輸出 / 国内の比率の傾向を調べました。2015年以降は輸出のほうが多くなっていることがわかりました。 今回は、月によって、輸出 / 国内 の比率に傾向があるかどうかを調べたいと思います。 まずは、read.csv関数…

鉱工業出荷内訳表の分析7 - 輸出 / 国内 の比率をファクタに変換して、クロス表分析(cut関数, table関数, chisq.test関数)

今回は、鉱工業集荷内訳表のデータを加工した、輸出 / 国内 の比率を1.0より大きいなら輸出超、1.0以下なら国内超という2つのファクタに変換して、クロス表分析をしたいと思います。このブログの名前がCross_Hyouなのに最近、全然クロス表分析をしていません…

鉱工業出荷内訳表の分析6 - 輸出 / 国内 比率の推移をグラフにして見る。(plot関数)

今回は、鉱工業出荷内訳表のデータを使って、前回のブログで作成した、輸出 / 国内 比率の推移をグラフにしてみようと思います。 まずは、前回までのおさらいで、R言語のコマンドを実行します。実行したコマンドは以下のようなものです。 # 鉱工業出荷内訳表…

鉱工業出荷内訳表の分析5 - 輸出と国内の比率を計算し、基本統計量を計算する。(summary関数, apply関数とsd関数)

今回は、鉱工業出荷内訳表のデータから輸出と国内の比率を計算して、その比率の基本統計量を算出してみようと思います。出荷内訳、輸出と国内の内訳ですから、その比率が重要かな?と思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読…

鉱工業出荷内訳表の分析4 - 2つのデータの分布の違いを検定する。2標本のK-S検定(ks.test関数)

今回は、鉱工業出荷内訳表のデータを使って、2つのデータの分布の違いを検定してみたいと思います。具体的には、前回、前々回でも取り上げた、平均値が最大のデータのはん用.国内と平均値が最小のデータの情報通.国内を比較します。もう一組は、標準偏差が最…

鉱工業出荷内訳表の分析3 - データのバラツキをヒストグラムにして見える化する。(hist関数)

今回は、鉱工業出荷内訳表のデータのヒストグラムを作成しようと思います。 48のデータの種類全部をヒストグラムにするのは骨が折れるので、前回と同じく平均値が一番大きいデータのはん用.国内、平均値が一番小さいデータの情報通.国内、標準偏差の一番大き…

鉱工業出荷内訳表の分析2 - データの推移をグラフにして観る。(plot関数)

今回は、鉱工業出荷内訳表のデータをグラフにしようと思います。とはいっても、データの種類が48もあるので、前回の分析で判明した、平均値が一番大きかった、はん用.国内、平均値が一番小さかった、情報通.国内、標準偏差が一番大きかった、情報通.輸出、標…

鉱工業出荷内訳表の分析1 - 基本統計値の算出(summary関数、apply関数とsd関数\max関数\min関数\mean関数\median関数)

今回は、鉱工業出荷内訳表のデータを分析してみましょう。e-Stat(政府統計の総合窓口)のサイトを訪問したら、今日の新着データで、「鉱工業出荷内訳表」というデータがありました。 鉱工業生産は聞いたことがありましたが、鉱工業出荷内訳表というのは、お恥…

花き産業振興総合調査の分析5 - 花き産業は衰退傾向と言えるのか?回帰分析で確認(lm関数)

今回は、花き産業振興総合調査のデータで、花き産業は衰退しているのかを見てみたいと思います。 まずは、read.csv関数でデータを読み込み、summary関数でデータの要約を表示します。 出荷額の推移を年ごとにみてみましょう。tapply関数とsum関数で年ごとの…

花き産業振興総合調査の分析4 - 各データの散布図(plot関数)と相関を見る(cor関数)

今回は、花き産業振興総合調査のデータを相関関係から見てみたいと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読み込みます。 相関係数を求める関数は、cor関数です。cor関数はデータフレームが数値データだけだと、そのデータフレ…

花き産業振興総合調査の分析3 - 種類ごとの経年変化を見る。棒グラフで見える化(barplot関数)

今回は、ツツジ、サツキなど種類ごとの経年変化を見たいと思います。 まずは、csvファイルに保存してあるデータをR言語のread.csv関数で読込み、summary関数でデータの要約をします。 サツキだけのデータフレーム、ツツジだけのデータフレーム、など種類ごと…

花き産業振興総合調査の分析2 - 2016年のデータで並び替え(order関数, names関数)

今回は、花き産業振興総合調査のデータを使って、2016年のデータを並び替えたいと思います。まずは、read.csv関数を使ってデータを読込みます。読込んだデータをsummary関数をつかって要約を表示します。 このデータセットは、2009年から2016年まで、8年分の…