crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

東証の業種別空売り集計データの分析1 - R言語でデータを読み込み基本統計量を出す。

今回は東証の業種別空売りデータを分析しようと思います。

空売り集計 | 日本取引所グループ

このサイトからPDFファイルをダウンロードしました。

f:id:cross_hyou:20200613170413j:plain

こういうデータです。

それと、

リアルタイム株価指数値一覧 | 日本取引所グループ

このサイトの業種別指数の前日比(%)のデータを使います。

f:id:cross_hyou:20200613170525j:plain

この二つをまとめて、

f:id:cross_hyou:20200613170607j:plain

こういうCSVファイルにしました。

このデータを読み込んで、前日比は空売り比率と関連があるのか無いのか調べようと思います。

R言語のread.csv関数でファイルを読み込みます。

f:id:cross_hyou:20200613171025j:plain

str関数で読み込んだデータの構造確認をしました。

データフレームとして読み込まれ、33のobservationsと4のvariablesがあります。

summary関数で平均値などを確認します。

f:id:cross_hyou:20200613171324j:plain

規制有りの空売りの平均は35.05%です。規制無しの空売りの平均は7.615%です。前日比の平均は-1.321%です。

var関数で分散、sd関数で標準偏差を出します。apply関数を使って効率よくやります。

f:id:cross_hyou:20200613171652j:plain

分散や標準偏差はもともののデータの水準に左右されるので、規制有り、規制無し、前日比のなかでどれが一番バラツキがあるか、わかりません。標準偏差を平均値で割った変動係数(CV)を計算します。

f:id:cross_hyou:20200613171937j:plain

規制有りが一番バラツキが小さく、前日比が一番バラツキが大きいことがわかります。

今回は以上です。