Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

外資系企業動向調査の分析２ - R言語のas_tibble関数でtibbleに変換して、filter関数、select関数、mutate関数、arrange関数

データ分析

www.crosshyou.info

の続きです。

前回は e-Statから出力したファイルをそのままR言語に読込ませて、R言語上で整理されたデータにする、という作業でした。

今回は各データを大きい順に並び替えてみましょう。

せっかくだから、tidyverseパッケージを使ってみましょう。

まずは、tidyverseパッケージをインストールします。install.packages関数です。

f:id:cross_hyou:20190221193131j:plain

インストールしたら、library関数で読込みます。

f:id:cross_hyou:20190221193331j:plain

まずは、データフレームを as_tibble関数で tibble に変換します。

f:id:cross_hyou:20190221193623j:plain

tibbleはhead関数を使わなくても、はじめの数行、10行しか表示しません。そして、str関数を使わなくてもこのデータフレームが261観測、9変数だとわかりますし、各変数の型もわかります。

arrange関数で並び替えましょう。

f:id:cross_hyou:20190221194225j:plain

2015年が3681社で一番多いですね。

操業中で並び替えます。

f:id:cross_hyou:20190221194405j:plain

これも2015年度ですね。

設立後初決算前で並び替えます。

f:id:cross_hyou:20190221194607j:plain

2011年度が一番多く24社です。

未設立未操業で並び替えます。

f:id:cross_hyou:20190221194759j:plain

2013年度、2012年度、2008年度が8社で一番多いです。

休眠中で並び替えます。

f:id:cross_hyou:20190221195147j:plain

2008年度が78社で一番です

撤退で並び替えます。

f:id:cross_hyou:20190221195339j:plain

2010年度が172社で一番多いです。

調査対象外で並び替えます。

f:id:cross_hyou:20190221195553j:plain

2007年度が106社で一番です。

業種を合計だけに絞り込んでみましょう。filter関数です。

f:id:cross_hyou:20190221200050j:plain

さらにselect関数で年度から操業中までを表示しましょう。

f:id:cross_hyou:20190221200323j:plain

select関数では変数A:変数B とすると、変数Aと変数Bの間にあるすべての変数を選択できます。

さらに、mutate関数で操業率(操業中 / 合計)を計算しましょう。

f:id:cross_hyou:20190221200821j:plain

さらに、arrange関数で操業率の大きい順にしましょう。

f:id:cross_hyou:20190221201203j:plain

2014年度が 92.8%で一番高く、2009年度が89.3%で一番低いです。3ポイントぐらいしか違わないですね。

今回は以上です。

次回は

www.crosshyou.info

です。