(Bing Image Creator で生成: プロンプト: Landscape of flowering Wisteria floribunda trees, background is blue sky, photo.)
いままではクロスセクションのデータばかり分析してきましたが、今回は時系列データを分析してみようと思います。時系列データで何がいいかな、と思いましたが、景気動向指数の構成要素の時系列データが政府統計の総合窓口(www.e-stat.go.jp)から取得できるので、それを使うことにしました。
こんな感じのデータです。これをダウンロードしました。
Rにアップロードする前にCSVファイルを少し加工して、上の図にようにしました。せっかく時系列データを分析するので、最終的には予測モデルを作成したいと思いましたので、ターゲットの変数として、東証株価指数の対前月比(当月の値 / 前月の値)という変数を作成しました。それと、開始月を 1としたインデックスも追加しています。
それでは、これをRにアップロードします。まず tidyverseパッケージの読み込みをしておきます。
read_csv()関数で CSVファイルのデータを読み込みます。
chr (1): time となっているので、timeがうまく日付として認識できていないようです。
修正します。ymd()関数を使うと日付型にかわります。
Topixのグラフを描いてみます。
0.8 以下のときもありますね。0.8ということは、20%以上の下落です。2010年の少し前ですから、リーマンショックのときでしょうか。。
Topixのサマリーも確認しておきます。
Median, Meanともに 1.005ですね。0.5%が平均、中央値です。
今回はここまでとします。
次回は
です。
今回のコードは以下のとおりです。
#
# tidyverse の読み込み
library(tidyverse)
#
# CSVファイルの読み込み
df_raw <- read_csv("ts_master.csv", skip = 13)
#
# timeを日付型に修正
df <- df_raw |>
mutate(time = ymd(time))
df
#
# Topixのグラフ
ggplot(df, aes(x = time, y = Topix)) +
geom_line()
#
# Topixのサマリー
summary(df$Topix)
#