UnsplashのSingle.Earthが撮影した写真
今回は都道府県別の個人企業経済調査のデータの分析をしてみたいと思います。
(振り返ってみると、2021年3月にもこのデータを分析していましたが、自分の中ではすっかり忘れていました。)
政府統計の総合窓口、www.e-stat.go.jp のウェブサイトからデータを取得します。
個人企業経済調査は、個人企業(個人企業の事業所)の経営の実態を明らかにし、中小企業振興のための基礎資料などを得ることを目的として実施しています。
とのことです。
表番号0801の産業大分類別営業状況 - 全国、都道府県 というデータを取得してみます。
こんな感じのデータでした。
データ項目がたくさんあったので、業種分類は、「製造業」と「卸売業、小売業」の」2つに、経営状態の項目は売上高、給料賃金、営業利益の3つに絞り込みました。3つとも1企業あたりの値です。
出力したCSVファイルはこんな感じです。11行目に変数名を追加しています。
このCSVファイルをR言語に取り込んで分析します。
はじめに必要な、または必要と思われるパッケージを読み込んでおきます。
tidyverse, gridExtra, moderndive, inferパッケージをlibrary()関数で読み込みました。
tidyverseはデータ分析するときに便利なパッケージ、girdExtraはグラフを複数表示するときに使います。moderndiveは、Statistical Inference via Data Science (moderndive.com) を現在、読んでいるので読み込みました。inferパッケージはこのmoderndive.comで紹介されてので読み込みました。
それでは、read_csv()を使ってCSVファイルを読み込みます。
glimpse()関数を使って、データが正しく読み込まれているか確認してみます。
問題なく読み込んでいました。
少し変更を加えましょう。
year_codeを4桁の数値に、year、pref_code, pref, indu_code, induをファクター型に、
induの"卸売業、小売業"を"卸売小売業"に変換します。
mutate()関数の中で、as.factor()関数でファクター型に変換するのと、ifelse()関数で"卸売業、小売業"を"卸売小売業"に変換しました。
glimpse()関数で確認してみます。
うまくできました。
今回は以上です。
次回は、
です。
今回、使用した関数は以下のものでした。
library() --- パッケージの読み込み
read_csv() --- CSVファイルの読み込み
glimpse() --- データフレームの内容を確認
mutate()関数 --- データフレームの変数操作
as.factor()関数 --- ファクター型に変換
ifelse()関数 --- 条件によって変数を操作