の続きです。
前回は e-Statから出力したファイルをそのままR言語に読込ませて、R言語上で整理されたデータにする、という作業でした。
今回は各データを大きい順に並び替えてみましょう。
せっかくだから、tidyverseパッケージを使ってみましょう。
まずは、tidyverseパッケージをインストールします。install.packages関数です。
インストールしたら、library関数で読込みます。
まずは、データフレームを as_tibble関数で tibble に変換します。
tibbleはhead関数を使わなくても、はじめの数行、10行しか表示しません。そして、str関数を使わなくてもこのデータフレームが261観測、9変数だとわかりますし、各変数の型もわかります。
arrange関数で並び替えましょう。
2015年が3681社で一番多いですね。
操業中で並び替えます。
これも2015年度ですね。
設立後初決算前で並び替えます。
2011年度が一番多く24社です。
未設立未操業で並び替えます。
2013年度、2012年度、2008年度が8社で一番多いです。
休眠中で並び替えます。
2008年度が78社で一番です
撤退で並び替えます。
2010年度が172社で一番多いです。
調査対象外で並び替えます。
2007年度が106社で一番です。
業種を合計だけに絞り込んでみましょう。filter関数です。
さらにselect関数で年度から操業中までを表示しましょう。
select関数では変数A:変数B とすると、変数Aと変数Bの間にあるすべての変数を選択できます。
さらに、mutate関数で操業率(操業中 / 合計)を計算しましょう。
さらに、arrange関数で操業率の大きい順にしましょう。
2014年度が 92.8%で一番高く、2009年度が89.3%で一番低いです。3ポイントぐらいしか違わないですね。
今回は以上です。
次回は
です。