crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

データ分析

産業別会社の財務営業比率の分析6 - R言語で2つの変数の関係性を見る(カテゴリ変数とカテゴリ変数)

www.crosshyou.info の続きです。 今回は、カテゴリ変数とカテゴリ変数の関係性をみてみましょう。 とはいってもこの産業別会社の財務営業比率のデータを見ますと、 カテゴリ変数は、「産業」だけです。カテゴリ変数はファクタなので、データの種類が<fct>となっ</fct>…

産業別会社の財務営業比率の分析5 - R言語で2つの変数の関係性を見る(カテゴリ変数と連続変数)

www.crosshyou.info の続きです。今回は2つの変数間の関係性を見てみようと思います。 2つの変数というと、パターンは、 カテゴリ変数と連続変数 カテゴリ変数とカテゴリ変数 連続変数と連続変数 の3つのパターンが考えられますが、今回はカテゴリ変数と連…

産業別会社の財務営業比率の分析4 - R言語のgroup_by関数とsummarize関数でグループごとの平均値などを算出する

www.crosshyou.info の続きです。 今回はgroup_by関数とsummarize関数で産業別、年代別の平均値などを算出したいと思います。 データセットはこういうものでした。 早速、group_by関数とsummarize関数を使って、借入金利子率の産業別の平均値を算出してみま…

産業別会社の財務営業比率の分析3 - R言語のarrange関数やselect関数でデータを並び替え表示する

www.crosshyou.info の続きです。 今回はarrange関数とかselect関数で変数の大きい順、小さい順にデータを表示したいとおもいます。 変動が一番大きかった「内部留保率」の大きい順、小さい順を表示してみましょう。 select関数で必要な変数だけをセレクトし…

産業別会社の財務営業比率の分析2 - R言語のggplot関数でグラフを描いてみる

www.crosshyou.info の続きです。 今回はR言語のggplot関数を使って、いくつかグラフを描いてみようと思います。 産業別の当座比率の経年変化のチャートです。ggplot関数のgeom_line関数で折れ線グラフを書いています。 1980年代にとても高くなっている業種…

産業別会社の財務営業比率の分析1 - R言語で基本統計量を取得する

今回からは、産業別会社の財務営業比率のデータを分析したいと思います。 データ元は、 www.stat.go.jpの の6-14 産業別会社の財務営業比率(エクセル:116KB)です。 こういうファイルです。 これをR言語に読込ませるために、以下のようなCSVファイルにしまし…

貯蓄動向調査の分析5 - 全世帯と勤労者世帯では年間収入、貯蓄率、負債率、貯蓄負債バランスに違いがあるかをR言語で検定

www.crosshyou.info の続きです。 前回までの分析で、全世帯と勤労者世帯を比較すると、年間収入はほとんど同じ、貯蓄率は全世帯が高い、負債率は全世帯が若干高いようなことがグラフでわかりました。 そこで今回は統計的に全世帯と勤労者世帯で差があるのか…

貯蓄動向調査の分析4 - R言語のgeom_lineで年間収入、貯蓄率、負債率の推移の折れ線グラフを描く

www.crosshyou.info の続きです。 前回までで作成したtibble形式のデータセットはこちらでした。 これに負債率もmutate関数で計算して加えましょう。 年次が昭和34年などと和暦なので西暦の列を加えます。mutate関数です。 View関数で全体を表示してみます…

貯蓄動向調査の分析3 - R言語のdplyrパッケージの練習

www.crosshyou.info の続きです。 今回は、R言語のdplyrパッケージの関数の練習をしてみようと思います。 まずは、library関数でtidyverseパッケージを呼び込みます。 どのような変数があるか確認しましょう。str関数です。 dplyrパッケージの5つの主要な関…

貯蓄動向調査の分析2 - R言語のggplot関数の練習(geom_histogram関数、grom_freqpoly関数、geom_point関数)

www.crosshyou.info の続きです。 今回はR言語のggplot関数の練習をしてみます。 まずは、tidyverseパッケージをlibrary関数で呼び出します。 まずは、「世帯数」のヒストグラムを作成してみます。その前にsummary関数で「世帯数」がどんなものか確認してお…

貯蓄動向調査の分析1 - 基本統計量をR言語で取得(read.csv関数 >> summary関数 と str関数)

今回は、貯蓄動向調査のデータを分析したいと思います。 政府統計の総合窓口、e-Statのデータベースからデータをダウンロードしました。 こういうサイトですね。このサイトの右側にある「ダウンロード」をクリックして取得したファイルがこれです。 これを整…

一般職国家公務員在職状況統計表の分析2 - R言語のdplyrパッケージを利用してデータ操作の練習その2

www.crosshyou.info の続きです。今回も引き続き、dplyrパッケージを利用してデータ操作の練習をしてみます。 まずは、CSVファイルにあるデータをread.csv関数で呼び出し、summary関数で基本統計量を算出します。 tidyverseパッケージを呼び出します。 前回…

一般職国家公務員在職状況統計表の分析1 - R言語のdplyrパッケージを利用してデータ操作の練習をする。

政府統計の総合窓口(e-Stat)を見てみたら、一般職国家公務員在職状況統計表といデータが新着でありました。 こういうのですね。 このデータをCSVファイルでこのように加工しました。 これをread.csv関数でR言語に読込み、分析の練習をしてみたいと思います。…

消費者物価指数の分析6 - R言語の時系列分析(ts関数、plot関数、acf関数を使ってみた)

www.crosshyou.info の続きです。消費者物価指数のデータは時系列データですから、R言語で時系列の分析の練習をしようと思います。参考にした本は、 現場ですぐに使える! R言語プログラミング逆引き大全 350の極意 作者: 金城俊哉 出版社/メーカー: 秀和シス…

消費者物価指数の分析5 - R言語で一番物価が上昇した品目、下落した品目を調べてみる

今回は www.crosshyou.info の続きです。 今回はR言語の練習で、1970年と2017年を比較して一番物価が上昇した変数、下落した変数を調べてみたいと思います。 このようなデータフレームを前回までで作成しました。 1列目が「年」で最終列の69列目が「年代」で…

消費者物価指数の分析4 - R言語のggplot関数のgeom_point関数で散布図を描く

引き続き、 www.crosshyou.info の続きです。前回の分析で「総合」と正の相関が一番強いのが「履物類」、負の相関が一番強いのが「家庭用.耐久財」、無相関に一番近いのが「通信」だとわかりました。 今回はこの3変数の組み合わせで散布図を描いてみたいと…

消費者物価指数の分析3 - R言語のcor関数で相関係数を調べる

www.crosshyou.info に引き続き、消費者物価指数のデータで遊びたいと思います。 前回の分析で各変数の推移をグラフにしましたが、いろいろな動きがありました。 そこで、今回はR言語で「総合」の消費者物価指数と一番相関の高い、低い、無相関の変数は何か…

消費者物価指数の分析2 - R言語のplot関数でグラフを描く

www.crosshyou.info の続きです。前回は、消費者物価指数(年平均)のデータをR言語に読込ませ、平均値などの記述統計量を算出しました。前回作成したデータフレームは、下図のようなものでした。 このようなデータフレームですが、この中の変数でNAがある変数…

消費者物価指数の分析1 - R言語で最小値、最大値、平均値、中央値、標準偏差などの基本統計量を算出する。

今回は消費者物価指数のデータを使ってR言語での分析を練習しようと思います。 e-Stat(政府統計の総合窓口)からデータのファイルを取得します。 このなかの「年平均」のExcelファイルを開いてみました。 こういうファイルでした。このファイルをR言語に読込…

資金循環勘定(平成28年度)の分析2 - R言語で資産残高と負債残高のランキングを作成

www.crosshyou.info 今回は前回(上記の記事です)の続きで、資金循環勘定の分析をR言語でやってみます。 まずは、前回と同じくデータをread.csv関数でR言語に読みこみ、summary関数とhead関数でデータを表示します。 今回は資産残高ランキングを作成してみま…

資金循環勘定(平成28年度)の分析1 - R言語で基本統計量を算出

今回からは、資金循環勘定(平成28年度)のデータをR言語で分析してみようと思います。 統計局ホームページ/日本の統計 2018−第4章 通貨・資金循環 このサイトにある、 この4-5 資金循環勘定(エクセル:37KB)というファイルです。 実際のファイルはこんな感じ…

県民経済計算の分析7 - R言語でクロス表分析。経済規模、裕福さ、民間政府比率は関連性あり

前回のブログ www.crosshyou.info に続いて、今回はR言語でクロス表分析をしたいと思います。前回までで作成したデータフレームはこんなものでした。 成長性偏差値、経済規模偏差値、裕福さ偏差値、民間政府偏差値それぞれの変数の50以上の値を高成長、大規…

県民経済計算の分析6 - R言語でクラスター分析

今回は、県民経済計算のデータを使ってクラスター分析をしてみようと思います。 前回のブログは以下のリンクからご覧ください。 www.crosshyou.info まずは、R言語でデータを読み込んで、成長性などを偏差値で表したデータフレームを見てみます。 このような…

県民経済計算の分析5 - 成長性・規模・裕福さの偏差値を計算して総合スコアを計算する

今回は、前回のブログ、 www.crosshyou.info の続きで、R言語を使って成長性・規模、裕福さの3つの指標の偏差値を算出してそれらを合計した総合スコアを計算しようと思います。 まずは、前回作成したデータフレームを再掲します。 偏差値はどうやって計算す…

県民経済計算の分析4 - 成長性・規模・民間と政府のバランス・裕福さの上位都道府県はどこか?

今回は県民経済分析のデータを使って前回の続きをしていきます。 前回のブログ、 www.crosshyou.info では、新しく「対数名目」、「民間政府」、「対数一人当たり」という変数を作成しました。この変数と「対前年度増加率」のランキングを作成しましょう。 …

県民経済計算の分析3 - ヒストグラムを描く(hist関数)

今回は県民経済計算のデータのヒストグラムを描こうと思います。 前回はのブログはこちらです。 www.crosshyou.info まずは、CSVファイルに保存してあるデータをread.csvファイルに読込み、summary関数で平均値や中央値を表示します。 hist関数でヒストグラ…

県民経済計算の分析2 - ggplot関数のgeom_point関数で散布図を描く

今回は県民経済計算のデータを使ってR言語のggplot関数で散布図を描いてみたいと思います。 まずは、前回やったCSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数で平均値などを表示します。 続いてggplot関数を使うために、libra…

県民経済計算の分析1 - 基本統計量

今回は、都道府県別の県内総生産などのデータ分析をしてみたいと思います。 データは、「日本の統計」のウェブサイト、 www.stat.go.jpここから取得しました。 この3-15 県民経済計算 というファイルです。 実際のファイルがこれです。 これをR言語に読込ま…

国籍別在留外国人数の分析5 - 増減幅の上位・下位、増減率の上位・下位で二分してクロス表分析

今回は、国籍別在留外国人数のデータを使って、増減幅の上位・下位、増減率の上位・下位で二分したカテゴリカル変数を作成し、クロス表分析をしてみたいと思います。 前回までで、下図のようなR言語のデータフレームを作成しました。 平成26、27、28は国籍別…

国籍別在留外国人数の分析4 - 地域によって増減率に違いはあるだろうか?

今回は、国籍別在留外国人数のデータを使って、地域によって増減率に違いはあるだろうか?ということを検証したいと思います。 R言語にこんな形でデータフレームを作成しています。 地域としてはアジアが15か国、ヨーロッパが11か国と多いので、この2つの地…