Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

失業率・第3次産業活動指数・消費者物価指数の時系列データ分析1 - R でデータを読み込む。

Bing Image Creator で生成: Beautiful early spring nature landscape Japan

今までクロスセクションのデータばかりを扱ってきましたので、今回は時系列データの分析の練習をしてみたいと思います。

使用するデータは、全国ベースの失業率、第3次産業活動指数、物価の時系列です。

データは統計ダッシュボードのウェブサイトから取得しました。

統計ダッシュボード - データ検索画面 (e-stat.go.jp)

理論的な背景は、

R のコードは、

を参考にしています。

ウェブサイトからデータをダウンロードして、変数名を加えたCSVファイルはこんな感じです。

これを R に読み込みます。

はじめに tidyverse パッケージ、lubridate パッケージと dynlm パッケージを読み込んでおきます。

read_csv() 関数で CSVファイルにデータを読み込みます。

glimpse() 関数で、読み込んだデータがどんな様子かみてみます。

time が 文字列型になっているので、これを日付型にするのと、NA がある列をの削除する処理をします。

summary() 関数で df をみてみましょう

2013年1月から2021年12月までのデータです。

失業率は、最小値は2.1%, 最大値は4.4%, 平均値は3.033% です。

第3次産業活動指数は、最小値は83.10, 最大値は114.30, 平均値は100.12 です。

消費者物価指数の前年同期比は、最小値は -1.2%, 最大値は3.7%, 平均値は0.6657% です。

ts() 関数で ts オブジェクトも作成しておきます。

これで、分析のためのデータフレームオブジェクトの df と、時系列オブジェクトの dts が用意できました。

今回は以上です。

次回は、

www.crosshyou.info

です。