2018-11-01から1ヶ月間の記事一覧
今回はWorld BankのDataBankからデータをダウンロードしてG7とBRICのGDP等のデータを分析してみましょう。 databank.worldbank.orgこれでから、いろいろやってみて以下のようなエクセルファイルをダウンロードしました。 これを加工してR言語に読込みやすい…
www.crosshyou.info に引き続き、就業構造基本調査のデータ分析をしていきます。 前回までで「仕事者率」「家事者率」「通学者率」という変数を計算し、男性のほうが女性よりも「仕事者率」が高いことがわかりました。 今回は、「仕事者率」を被説明変数にし…
www.crosshyou.info の続きです。 前回の分析で、仕事者比率が男性のほうが女性よりも高いことがわかりました。 これを統計学的に検定してみましょう。 下記のように、男性の平均仕事者率は0.581で女性は0.418です。 男性、女性の仕事者率の分布をヒストグラ…
www.crosshyou.info の続きです。data_exの変数を改めてみてみます。 変数で、「仕事が主な者」「家事が主な者」「通学が主な者」と~~が主な者という変数があります。これと「総数」を組み合わせて、、仕事が主な者の割合、家事が主な者の割合、通学が主な…
www.crosshyou.info の続きです。 今回はR言語のggolot2パッケージの関数を使ってヒストグラムや箱ひげ図を作図してみようと思います。 まず、「男女」「年齢」「続柄など」の3つのカテゴリ変数に"総数"という値があるので、これを削除したデータセット(tib…
www.crosshyou.info の続きです。 今回は前回データを読み込んだ就業構造基本調査のデータをdplyrパッケージを使っていろいろデータ変換する練習です。参考にする文献は Rではじめるデータサイエンス 作者: Hadley Wickham,Garrett Grolemund,大橋真也,黒川…
今回は、就業構造基本調査のデータを分析したいと思います。 政府統計の総合窓口(e-Stat)から 平成29年の「男女、世帯主との続き柄・一般・単身世帯・配偶関係、年齢、就業状態・仕事の主従別人口(15歳以上) - 全国」のデータを使ってR言語での分析の練習を…
日本型資本主義-その精神の源 (中公新書) 作者: 寺西重郎 出版社/メーカー: 中央公論新社 発売日: 2018/08/17 メディア: 新書 この商品を含むブログを見る 日本の資本主義は欧米で発達したキリスト教を基盤とする資本主義ではなく、鎌倉時代に発展した仏教を…
www.crosshyou.info の続きです。 今回は、連続変数と連続変数の関係性を見てみます。具体的には、R言語のggplot関数のgeom_point関数で散布図を作成してみます。 試しに自己資本比率と労働装備率の散布図を作成してみます。 産業別や年代別を考慮していない…
www.crosshyou.info の続きです。 今回は、カテゴリ変数とカテゴリ変数の関係性をみてみましょう。 とはいってもこの産業別会社の財務営業比率のデータを見ますと、 カテゴリ変数は、「産業」だけです。カテゴリ変数はファクタなので、データの種類が<fct>となっ</fct>…
www.crosshyou.info の続きです。今回は2つの変数間の関係性を見てみようと思います。 2つの変数というと、パターンは、 カテゴリ変数と連続変数 カテゴリ変数とカテゴリ変数 連続変数と連続変数 の3つのパターンが考えられますが、今回はカテゴリ変数と連…
www.crosshyou.info の続きです。 今回はgroup_by関数とsummarize関数で産業別、年代別の平均値などを算出したいと思います。 データセットはこういうものでした。 早速、group_by関数とsummarize関数を使って、借入金利子率の産業別の平均値を算出してみま…
www.crosshyou.info の続きです。 今回はarrange関数とかselect関数で変数の大きい順、小さい順にデータを表示したいとおもいます。 変動が一番大きかった「内部留保率」の大きい順、小さい順を表示してみましょう。 select関数で必要な変数だけをセレクトし…
www.crosshyou.info の続きです。 今回はR言語のggplot関数を使って、いくつかグラフを描いてみようと思います。 産業別の当座比率の経年変化のチャートです。ggplot関数のgeom_line関数で折れ線グラフを書いています。 1980年代にとても高くなっている業種…
今回からは、産業別会社の財務営業比率のデータを分析したいと思います。 データ元は、 www.stat.go.jpの の6-14 産業別会社の財務営業比率(エクセル:116KB)です。 こういうファイルです。 これをR言語に読込ませるために、以下のようなCSVファイルにしまし…
www.crosshyou.info の続きです。 前回までの分析で、全世帯と勤労者世帯を比較すると、年間収入はほとんど同じ、貯蓄率は全世帯が高い、負債率は全世帯が若干高いようなことがグラフでわかりました。 そこで今回は統計的に全世帯と勤労者世帯で差があるのか…
www.crosshyou.info の続きです。 前回までで作成したtibble形式のデータセットはこちらでした。 これに負債率もmutate関数で計算して加えましょう。 年次が昭和34年などと和暦なので西暦の列を加えます。mutate関数です。 View関数で全体を表示してみます…
www.crosshyou.info の続きです。 今回は、R言語のdplyrパッケージの関数の練習をしてみようと思います。 まずは、library関数でtidyverseパッケージを呼び込みます。 どのような変数があるか確認しましょう。str関数です。 dplyrパッケージの5つの主要な関…
www.crosshyou.info の続きです。 今回はR言語のggplot関数の練習をしてみます。 まずは、tidyverseパッケージをlibrary関数で呼び出します。 まずは、「世帯数」のヒストグラムを作成してみます。その前にsummary関数で「世帯数」がどんなものか確認してお…
今回は、貯蓄動向調査のデータを分析したいと思います。 政府統計の総合窓口、e-Statのデータベースからデータをダウンロードしました。 こういうサイトですね。このサイトの右側にある「ダウンロード」をクリックして取得したファイルがこれです。 これを整…
www.crosshyou.info の続きです。今回も引き続き、dplyrパッケージを利用してデータ操作の練習をしてみます。 まずは、CSVファイルにあるデータをread.csv関数で呼び出し、summary関数で基本統計量を算出します。 tidyverseパッケージを呼び出します。 前回…
政府統計の総合窓口(e-Stat)を見てみたら、一般職国家公務員在職状況統計表といデータが新着でありました。 こういうのですね。 このデータをCSVファイルでこのように加工しました。 これをread.csv関数でR言語に読込み、分析の練習をしてみたいと思います。…
www.crosshyou.info の続きです。消費者物価指数のデータは時系列データですから、R言語で時系列の分析の練習をしようと思います。参考にした本は、 現場ですぐに使える! R言語プログラミング逆引き大全 350の極意 作者: 金城俊哉 出版社/メーカー: 秀和シス…
今回は www.crosshyou.info の続きです。 今回はR言語の練習で、1970年と2017年を比較して一番物価が上昇した変数、下落した変数を調べてみたいと思います。 このようなデータフレームを前回までで作成しました。 1列目が「年」で最終列の69列目が「年代」で…
引き続き、 www.crosshyou.info の続きです。前回の分析で「総合」と正の相関が一番強いのが「履物類」、負の相関が一番強いのが「家庭用.耐久財」、無相関に一番近いのが「通信」だとわかりました。 今回はこの3変数の組み合わせで散布図を描いてみたいと…