2018-08-01から1ヶ月間の記事一覧
今回の分析では、7月の青果物卸売市場調査のデータを使って、産地によって同じ野菜でも価格に違いがあるかどうか?を分析しようと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数でデータの要約統計量を表示…
今回も青果物卸売市場調査の7月のデータを使います。前回の分析で、出荷量が多い野菜は、キャベツ、レタス、はくさいがトップ3でした。今回は、この3品目に注目してみたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数で読込み、sum…
今回は青果物卸売市場調査のデータを使って、7月に一番数量の出た野菜は何かを調べたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数を使って読込み、summary関数を使ってデータの要約を表示しましょう。 品目名の列名のところを見る…
今回は、青果物卸売市場調査のデータを使って、7月の野菜価格の推移を見てみようと思います。 まずは、CSVファイルに保存してあるデータをR言語にread.csv関数を使って読み込ませます。 品目名にはどんなものがあるか、度数の多い順に並び替えて表示します…
いつものように、政府統計の総合窓口のサイト、e-Statを訪問したら、新着データで、「青果物卸売市場調査」というデータが新着でありました。 クリックしてみました。 本調査は、青果物卸売市場の取引状況を調査し、野菜50品目、果物44品目・品種別の日別・…
今回は前回に引き続き、建設総合統計でクロス表分析です。 前回は発注者と増減でクロス集計しましたので、今回は地域と増減でクロス集計です。 まずは、 csvファイルに保存してあるデータをread.csv関数で読込み 増減を計算し(ベクトルの引き算) 増減のカテ…
今回は、建設総合統計分析の前月からの増減を増加・減少のカテゴリカル変数にして、クロス表を作成し、カイ自乗検定をしようと思います。 まずは、csvファイルに保存してあるデータをread.csv関数でR言語に読込みます。 4月から5月の変化と、5月から6月…
前回の分析では、地域によって発注者の割合に違いがあることがわかりました。今回は月によって、具体的には、4月、5月、6月で発注者の割合に違いがあるのかをみてみようと思います。 まずは、データをread.csv関数でR言語に読込ませます。 4月の建設出来高を…
今回は建設総合統計のデータを使って、地域 x 発注者のクロス表を作成して地域によって発注者の割合に違いがあるかを見てみましょう。 まずは、データをread.csv関数で読込みます。 発注者は、その他、公団・独法・政府企業等、国、市区町村、地方公営企業、…
今回は、建設総合統計の分析です。 いつものようにe-Stat(政府統計の総合窓口)を訪問したら、新着データがありました。 建設総合統計は、国内の建設活動を出来高ベースで把握することを目的とした加工統計です。建築着工統計調査及び建設工事受注動態調査か…
前回の分析で、主要乳製品の生産量の割合は昭和60年と平成29年でかなり違っていることがわかりました。今回はこの2つの年のデータを比較して、割合が有意に違っているのかどうかを検定してみます。 まずは、csvファイルに保存してあるデータをread.csv関数で…
今回は、主要乳製品の生産量の割合を見てみようと思います。平成〇〇年は脱脂粉乳は20%でチーズは25%だった。。というような割合です。 まずはcsvファイルに保存してあるデータをread.csv関数でR言語に読込ませます。 生産量のデータだけのデータフレームを…
前回は、主要乳製品の伸び率を棒グラフで表示してみましたが、いまひとつ傾向がわかりませんでした。そこで今回はヒストグラムにしてみようと思います。 まずは、csvファイルにあるデータを読込みます。 伸び率のデータは、3, 5, 7, 9, 11, 13, 15, 17列にあ…
前回は、主要乳製品の生産量をグラフにしました。今回は、伸び率をグラフにしようと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読み込みます。 伸び率だけのデータフレームを作成します。 伸び率は、3列目から17列目までの奇数列に…
今回は、主要乳製品の生産量の推移をグラフにしてみたいと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読込みます。 バターの推移をグラフにしてみます。plot関数です。 plot(データ)でグラフになりますが、このように何もオプショ…
今回は前回に引き続き、牛乳乳製品生産動向のデータの主要乳製品の生産量を因子分析したいと思います。 前回までのR言語のコマンドを書くと以下のようになります。 # 牛乳乳製品生産動向 主要乳製品生産量milk <- read.csv("milk.csv")head(milk) # 生産量だ…
今回は主要乳製品の相関関係を見てみます。 まずは、csvファイルにあるデータをread.csv関数でR言語に読込みます。 このように、各製品の生産量(トン、アイスクリームはキロリットル)と前年伸び率(パーセント)のデータです。 バター、脱脂粉乳、れん乳類、全…
政府統計の総合窓口、e-Statのサイトに訪問をしたら、牛乳乳製品の生産動向という統計が新着でありました。 乳製品好きとしては、チェックしないではいられません。早速ファイルを見てみます。 本統計では、全国の生乳生産量、用途別処理量、地域別生乳生産…
前回は、鉱工業出荷内訳表のデータを使って、輸出 / 国内の比率の傾向を調べました。2015年以降は輸出のほうが多くなっていることがわかりました。 今回は、月によって、輸出 / 国内 の比率に傾向があるかどうかを調べたいと思います。 まずは、read.csv関数…
今回は、鉱工業集荷内訳表のデータを加工した、輸出 / 国内 の比率を1.0より大きいなら輸出超、1.0以下なら国内超という2つのファクタに変換して、クロス表分析をしたいと思います。このブログの名前がCross_Hyouなのに最近、全然クロス表分析をしていません…
今回は、鉱工業出荷内訳表のデータを使って、前回のブログで作成した、輸出 / 国内 比率の推移をグラフにしてみようと思います。 まずは、前回までのおさらいで、R言語のコマンドを実行します。実行したコマンドは以下のようなものです。 # 鉱工業出荷内訳表…
今回は、鉱工業出荷内訳表のデータから輸出と国内の比率を計算して、その比率の基本統計量を算出してみようと思います。出荷内訳、輸出と国内の内訳ですから、その比率が重要かな?と思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読…
今回は、鉱工業出荷内訳表のデータを使って、2つのデータの分布の違いを検定してみたいと思います。具体的には、前回、前々回でも取り上げた、平均値が最大のデータのはん用.国内と平均値が最小のデータの情報通.国内を比較します。もう一組は、標準偏差が最…
今回は、鉱工業出荷内訳表のデータのヒストグラムを作成しようと思います。 48のデータの種類全部をヒストグラムにするのは骨が折れるので、前回と同じく平均値が一番大きいデータのはん用.国内、平均値が一番小さいデータの情報通.国内、標準偏差の一番大き…
今回は、鉱工業出荷内訳表のデータをグラフにしようと思います。とはいっても、データの種類が48もあるので、前回の分析で判明した、平均値が一番大きかった、はん用.国内、平均値が一番小さかった、情報通.国内、標準偏差が一番大きかった、情報通.輸出、標…
今回は、鉱工業出荷内訳表のデータを分析してみましょう。e-Stat(政府統計の総合窓口)のサイトを訪問したら、今日の新着データで、「鉱工業出荷内訳表」というデータがありました。 鉱工業生産は聞いたことがありましたが、鉱工業出荷内訳表というのは、お恥…
今回は、花き産業振興総合調査のデータで、花き産業は衰退しているのかを見てみたいと思います。 まずは、read.csv関数でデータを読み込み、summary関数でデータの要約を表示します。 出荷額の推移を年ごとにみてみましょう。tapply関数とsum関数で年ごとの…
今回は、花き産業振興総合調査のデータを相関関係から見てみたいと思います。 まずは、csvファイルに保存してあるデータをread.csv関数で読み込みます。 相関係数を求める関数は、cor関数です。cor関数はデータフレームが数値データだけだと、そのデータフレ…
今回は、ツツジ、サツキなど種類ごとの経年変化を見たいと思います。 まずは、csvファイルに保存してあるデータをR言語のread.csv関数で読込み、summary関数でデータの要約をします。 サツキだけのデータフレーム、ツツジだけのデータフレーム、など種類ごと…
今回は、花き産業振興総合調査のデータを使って、2016年のデータを並び替えたいと思います。まずは、read.csv関数を使ってデータを読込みます。読込んだデータをsummary関数をつかって要約を表示します。 このデータセットは、2009年から2016年まで、8年分の…