Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東証の上場会社資金調達額のデータの分析1 - RにCSVファイルのデータを読み込む。

今回からしばらくは東京証券取引所の上場会社の資金調達金額のデータを使って分析遊びをしてみようと思います。

上場会社資金調達額 | 日本取引所グループ

その他統計資料のページの資金調達額のExcelファイルをダウンロードしました。

このようなファイルですが、今回は色をつけた列だけを使いました。日付、公募の件数、調達額、普通債の国内件数、国内調達額です。今回調べようと思うのは、季節性があるか?株式公募による調達と普通債による調達には相関があるか?を調べてみようと思います。

上の図のような必要な列だけのCSVファイルを作りました。もとのExcelファイルは値が無いときは、ー のような横棒でしたので、0に置換しています。このCSVファイルをRに読み込みます。最初にtidyverseパッケージの読み込みをします。

ファイルを読み込みます。read_csv()関数を使います。

上手く読み込んだかどうか、glimpse()関数でみてみましょう。

dateが日付型でなくて、文字列型ですね。mutate()関数とymd()関数を使います。

summary()関数でデータのサマリー統計量をみましょう。

今回のデータは1998年1月から2025年11月までのデータですね。株式公募での調達よりも債券での調達のほうが金額がとても大きいですね。株式公募は資金調達が無い月もありますが、債券のほうは毎月調達があることがわかりますね。

時系列のグラフを作ります。まずは株式公募のほうからです。

2009年から2011年にかけての時期が資金調達が多かったようですね。

債券のグラフを見てみます。

債券による資金調達は、最近のほうが金額が大きくなっている傾向があるようです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
# tidyverseパッケージの読み込み
library(tidyverse)
#
# CSVファイルの読み込み
df_raw <- read_csv("tse_shikin.csv")
#
# データの確認
glimpse(df_raw)
#
# dateを日付型に
df <- df_raw |> 
  mutate(date = ymd(date))
glimpse(df)
#
# データのサマリー
summary(df)
#
# 株式公募の時系列グラフ
df |> 
  ggplot(aes(x = date, y = eqy_val)) +
  geom_col()
#
# 債券の時系列のグラフ
df |> 
  ggplot(aes(x = date, y = bond_val)) +
  geom_col()
#

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは、Landscape of wide long natural land, close up of SAKURA trees, blue sky, a few white clouds, some small white flowers on the ground, photo です。)