Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

東証の規模別・業種別のPER・PBRのデータの分析1 - データを R に読み込み、summary() 関数で基本統計量を確認する

Bing Image Creator で生成 : Long wide view of emerald mountains

今回は、東証の規模別・業種別のPER・PBRのデータを分析してみます。

その他統計資料 | 日本取引所グループ (jpx.co.jp)

東証のプライム市場が始まった 2022年4月のデータと直近の2023年4月のデータを比較してみましょう。

まずは、ファイルをダウンロードします。

このような形態のファイルでした。

これを加工して、

このような CSV ファイルにしました。プライム市場のデータだけにして、必要な変数だけにしています。

各変数は、

year: 2022年か、2024年ですどちらも4月のデータです。

sectorID: 東証の33業種なので、1~33まであります。

sector: 東証の33業種です。

num: 銘柄数です。

per: 株価収益率(Price Earnings Ratio)です。

pbr: 株価純資産倍率(Price to Book Ratio)です。

profit: 純利益の合計です。1億円単位です。

equity: 株主資本の合計です。1億円単位です。

それでは、この CSV ファイルを R に取り込みます。

はじめに、tidyverse パッケージを読み込んでおきます。

read_csv() 関数で CSV ファイルを読み込みます。

データが正しく読み込まれたかどうか、glimpse() 関数と head() 関数で確認します。

あ!「パルプ紙」となるべくところが「パルプ神」になっていますね。

mutate() 関数と if_else() 関数で訂正します。

なおりました。

summary() 関数で基本統計量をみてみます。

per に NA が4つあるのは、利益、profit がマイナスなので、per が算出されない業種が4つあるからです。

今回は以上です。

次回は、

www.crosshyou.info

です。