crosshyou

主にクロス表(分割表)分析をしようかなと思います。

毎月勤労統計調査の分析V2_2 - もっと多くのデータで基本統計量を算出

前回のデータ量が少なかったので、今回はもっと大きなデータで毎月勤労統計調査のデータを分析したいと思います。 こんな感じです。 これがhead関数で始めの6行を表示したもの。 そして下図がsummary関数で要約統計量を表示したものです。 行番号もMaxが4640…

毎月勤労統計調査の分析V2_1 - 基本統計量(summary関数、apply関数とsd関数, mean関数)

今回は、毎月勤労統計調査の分析をしたいと思います。 以前にもこの統計は分析したことがあるので、2回目です。 e-Stat(政府統計の総合窓口)のサイトを訪問したら、毎月勤労統計が新着でありました。 クリックしてみました。 「毎月勤労統計調査全国調査は、…

貴金属流通統計調査の分析6 - 金の需要を線形回帰してみる。(lm関数)

今回は貴金属流通統計調査の金の需要データを使って、線形回帰の練習をしてみたいと思います。まずは、CSVファイルに保存しているデータをread.csv関数を使って読込みます。 このようなデータです。電機機械の需要が一番多いですね。グラフにしてみましょう…

貴金属流通統計調査の分析5 - 金の各需要の相関関係を見る。(plot関数、cor関数、cor.test関数)

今回は、金の各需要の相関関係を見たいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。 相関係数を出す関数はcor関数です。早速やってみましょう。 gold_matrix <- gold[ , c(-1,-2)] で計算に必要のない年と月の…

貴金属流通統計調査の分析4 - 金需要の平成29年と平成30年で違いがあるか?(t.test関数、wilcox.test関数、binom.test関数)

今回は、金の需要が平成29年と平成30年で増加、もしくは減少しているのかを調べたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。 平成29年は1月から10月まで、平成30年は1月から7月までのデータがありました。…

貴金属流通統計調査の分析3 - 金の需要の割合を円グラフで表示する。(pie関数)

今回は、貴金属流通統計調査のデータを使って、金の需要の割合を円グラフにしたいと思います。 まず、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。 このようなデータです。金の需要としては、電機・機械で使われたり、歯科医療で使…

貴金属流通統計調査の分析2 - 各需要の比率を計算する。

今回は、金の各需要の比率を計算しようと思います。 まずは、CSVファイルのデータをread.csv関数で読込みます。 どのようなデータか全体表示します。 元のデータファイルには、「その他」の項目もありましたが、このブログの分析では除外しています。なので…

貴金属流通統計調査の分析1 - 基本統計量(summary関数、mean関数、median関数、sd関数、min関数、max関数)

政府統計の総合窓口(e-Stat)のサイトを訪問したら、貴金属流通統計調査というデータが更新されていました。 どういうものでしょうか?クリックしてみました。 う~~ん、何も説明はないですね。さらにクリックします。 平成30年01~07月分の金、プラチナ、パ…

特定サービス産業動態統計調査の分析2 - for関数を使って20個のヒストグラムを一括作図する

今回は特定サービス産業動態調査の各業種のデータのヒストグラムをfor関数を使って一括作図してみます。 まず、CSV関数に保存してあるデータをread.csv関数で呼び出し、summary関数でデータの要約統計量をみてみます。 前回は標準偏差と変動係数(標準偏差 / …

特定サービス産業動態統計調査の分析1 - 基本統計量(summary関数、sd関数、mean関数、appy関数)

e-Stat(政府統計の総合窓口)に「特定サービス産業動態統計調査」というデータが新着でありました。 特定サービスとはどういうものでしょうか?クリックしてみます。 特定サービス産業動態統計調査は、19業種のサービス産業の売上高、契約高又は受注高等の経…

自動車輸送統計調査の分析7 - クロス表分析(table関数、chisq.test関数)

今回は自動車輸送統計調査の営業バスのデータを使って、クロス表分析をしましょう。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語で読込みます。head関数で始めの6行を表示しますね。 このようなデータです。どのデータが一番バラツキが大…

自動車輸送統計調査の分析6 - 営業バスの利用状況の伸び率と一人当りの輸送距離の相関関係を調べる。(cor関数)

今回は、自動車輸送統計の営業バスのデータを使って、平成22年度から平成29年度への利用の伸び率と一人当り輸送距離の相関関係を調べてみようと思います。 まずは、データをread.csv関数でR言語に読込み、head関数ではじめの6行を表示します。 このようなデ…

自動車輸送統計調査の分析5 - 営業バスの一人当りの移動距離を計算してみる。

今回は、自動車輸送統計調査の営業バスのデータを使って、一人当りの移動距離を計算してみようと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。 head関数で、最初の6行のデータを表示し、summary関数でデータの要…

自動車輸送統計調査の分析4 - 営業バス利用の伸びが高い都道府県はどこか?(order関数)

前回の分析で、自動車輸送統計調査の営業バスの利用の伸び率を計算しました。平成22年度と平成29年度を比較した伸び率です。 こんな感じです。 今回は、伸び率の大きいところ、小さいところを調べようと思います。 order関数で並びかえます。 はじめは、乗合…

自動車輸送統計調査の分析3 - 伸び率を計算して、ヒストグラムで分布を見る。(hist関数)

今回は、自動車輸送統計調査の営業バスのデータを使って、伸び率を計算してみようと思います。前回の分析では利用人数が多いのは人口の多い都道府県でした。伸び率が高い、あるいは低いのはどんな都道府県でしょうか? まずは、データをread.csv関数で読み込…

自動車輸送統計調査の分析2 - 各データで並び替え(order関数)

今回は、前回作成した自動車輸送統計調査の営業用バスのデータを並び替えて上位、下位の都道府県を調べてみたいと思います。 まずは、データをread.csv関数でR言語に呼び込み、head関数で始めの6行を表示してみましょう。 乗合定期人数29年で並び替えます。o…

自動車輸送統計調査の分析1 - 営業用バスの基本統計量

政府統計の総合窓口(e-Stat)のホームページを見たら、「自動車輸送統計調査」というデータが新着でありました。 自動車輸送統計調査は、国内で輸送活動を行う自動車を対象とする統計調査で、国の最も重要な統計調査として毎月実施しています。自動車輸送統計…

社会保障費用統計の分析5 - 減少と増加のシーケンスの連検定をする。(runs.test関数)

今回は、社会保障費用統計のデータを使って、連検定をしてみましょう。連検定とは、データがYesとNo、増加と減少、0と1のように二値からなるデータあって、その並び方がランダムなのか規則性があるのかどうかを調べるものです。 まずは、CSVファイルのデータ…

社会保障費用統計の分析4 - 全体に対する比率の増減でクロス表を作成し、Fisherの正確確率検定をする。(table関数、fisher.test関数)

今回は社会保障費用統計データを使って、全体に対する比率を算出し、その増減をカテゴリカル変数にしてクロス表分析をしたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数で呼び出し、summary関数をつかってどんなデータか見てみます…

社会保障費用統計の分析3 - 高齢のための社会保障費用を他のデータで回帰分析をする。(lm関数)

社会保障統計費用の分析の3回目は、回帰分析に挑戦してみたいと思います。 まずは、データをread.csv関数で読込みます。summary関数でデータの要約統計量を表示しました。 総額を除いたそれぞれのデータの相関マトリックスを見てみます。cor関数です。 高齢…

社会保障費用統計の分析2 - 全体に対する比率を求める

今回は、社会保障費用統計のデータで、どの種類の費用が多いのか、増えているのか、などを調べてみたいと思います。 まずは、read.csv関数でCSVファイルに保存してあるデータを読込みます。 総額の値で割って100倍してパーセント表示にします。 各コマンドを…

社会保障費用統計の分析1 - 基本統計量(summary関数, apply関数とsd関数,)

いつものように、e-Stat(政府統計の総合窓口)を訪問したら、社会保障費用統計というデータが新着でありました。 どんなデータでしょうか? クリックしてみました。 社会保障費用統計は、国立社会保障・人口問題研究所が、年金、医療保険、介護保険、雇用保険…

青果物卸売市場調査の分析6 - 一番多くの種類の野菜を出荷した産地はどこか?

今回は、青果物卸売市場調査のデータを使って、一番多くの種類の野菜を出荷した産地はどこなのか調べようと思います。 まずは、CSVファイルに保存してあるデータを、R言語に読込みます。read.csv関数を使います。そして、summary関数で要約統計量を表示しま…

青果物卸売市場調査の分析5 - 産地によって、なすの価格に違いはあるのか?(wilcox.test関数) 茨城は安く、群馬は高い

今回の分析では、7月の青果物卸売市場調査のデータを使って、産地によって同じ野菜でも価格に違いがあるかどうか?を分析しようと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数でデータの要約統計量を表示…

青果物卸売市場調査の分析4 - キャベツ、レタス、はくさいの出荷数量の多い産地は?(tapply関数とsum関数、order関数)。長野、おそるべし。。

今回も青果物卸売市場調査の7月のデータを使います。前回の分析で、出荷量が多い野菜は、キャベツ、レタス、はくさいがトップ3でした。今回は、この3品目に注目してみたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数で読込み、sum…

青果物卸売市場調査の分析3 - 7月に一番数量が出た野菜は何か?一番数量が出た産地はどこか?(tapply関数とsum関数、order関数)

今回は青果物卸売市場調査のデータを使って、7月に一番数量の出た野菜は何かを調べたいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数を使って読込み、summary関数を使ってデータの要約を表示しましょう。 品目名の列名のところを見る…

青果物卸売市場調査の分析2 - 7月の野菜の価格は上昇トレンドでした。(plot関数, barplot関数, stem関数)

今回は、青果物卸売市場調査のデータを使って、7月の野菜価格の推移を見てみようと思います。 まずは、CSVファイルに保存してあるデータをR言語にread.csv関数を使って読み込ませます。 品目名にはどんなものがあるか、度数の多い順に並び替えて表示します…

青果物卸売市場調査の分析1 - 基本統計量(summary関数, table関数, sd関数)

いつものように、政府統計の総合窓口のサイト、e-Statを訪問したら、新着データで、「青果物卸売市場調査」というデータが新着でありました。 クリックしてみました。 本調査は、青果物卸売市場の取引状況を調査し、野菜50品目、果物44品目・品種別の日別・…

建設総合統計の分析5 - 増減と地域でクロス表集計(table関数, fisher.test関数)。フィッシャーの直接確率検定

今回は前回に引き続き、建設総合統計でクロス表分析です。 前回は発注者と増減でクロス集計しましたので、今回は地域と増減でクロス集計です。 まずは、 csvファイルに保存してあるデータをread.csv関数で読込み 増減を計算し(ベクトルの引き算) 増減のカテ…

建設総合統計の分析4 - 前月からの増減を増加・減少のカテゴリカル変数にしてクロス表分析(chisq.test)

今回は、建設総合統計分析の前月からの増減を増加・減少のカテゴリカル変数にして、クロス表を作成し、カイ自乗検定をしようと思います。 まずは、csvファイルに保存してあるデータをread.csv関数でR言語に読込みます。 4月から5月の変化と、5月から6月…