crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

初婚年齢と住宅の広さのデータの分析 - 福島県が初婚年齢が一番低く、東京が高い。富山県が一番住宅が広く、東京が狭い。

今回は、初婚年齢と住宅の広さのデータを分析してみようと思います。 いつものように、政府統計の総合窓口、e-Statからデータを取得しました。 地域は47都道府県を選択しました。 夫の初婚年齢、妻の初婚年齢、住宅の広さの3つのデータを選択しました。 こん…

図書館数と図書館登録人数のデータの分析 - 神奈川は図書館少ない、山梨は多い。青森県は登録人数比率が低く、富山県は多い。

今回は、各都道府県の図書館の数と図書館登録人数を調べようと思います。 政府統計の総合窓口、e-Statからデータを取得します。 総人口と図書館数と図書館登録者数です。 エクセルにこのようにデータを取得しました。 read.csv関数でR言語にデータを読込み、…

都道府県別の平均気温と快晴日数と降雨日数のデータの分析 - 埼玉県が一番、快晴が多く、岡山県が一番、雨が少ない

今回は、都道府県別の平均気温と快晴日数と降雨日数のデータを分析してみようと思います。いつものように、政府統計の総合窓口(e-Stat)からデータを取得しました。 こんな感じのデータをダウンロードしました。 これをR言語に読込ませて、分析します。まずは…

男性役員数と女性役員数の比率の分析 - R言語のglm関数で比率データの回帰分析

今回は男性役員数と女性役員数の比率を分析しようと思います。 いつものように、データは政府統計の総合窓口(e-Stat)から取得しています。 地域は、47都道府県です。 データは、総人口、県内総生産額、役員数(男)、役員数(女)です。 このようなCSVファイルに…

消防機関の出動回数データの分析 - 沖縄県は出動回数の少ない県だ。

今回は消防機関の出動回数のデータを分析しようと思います。 消防機関の出動回数の定義は です。 www.e-stat.go.jpにありました。 政府統計の総合窓口(e-Stat)からデータを取得して、下のようなCSVファイルにしました。 出動回数だけなく、人口と生産額のデ…

読書記録 - 「平成経済 衰退の本質」金子勝 著 岩波新書

平成経済 衰退の本質 (岩波新書) 作者: 金子勝 出版社/メーカー: 岩波書店 発売日: 2019/04/20 メディア: 新書 この商品を含むブログを見る 平成の30年は日本経済にとっては衰退していった30年だった。 政府・省庁・大企業が失敗や不正をしても責任を取らな…

都道府県別の活動平均時間の分析 - 睡眠、身の回りの用事、食事の時間は女性のほうが長い。

今回は、政府統計の総合窓口から、都道府県別の1次活動の平均時間と県内総生産額のデータを分析してみます。 1次活動というのは、 www.e-stat.go.jpにありますが、睡眠、身の回りの用事、食事の時間です。 こんな感じでデータをサイトから取得しました。R言…

読書記録 - 「バックキャスト思考とSDGs/ESG投資」北川哲雄 編著

バックキャスト思考とSDGs/ESG投資 作者: 北川哲雄 出版社/メーカー: 同文舘出版 発売日: 2019/03/04 メディア: 単行本(ソフトカバー) この商品を含むブログを見る バックキャスト思考というのがどういうものかはわからなかったが、SDGsやESG投資について…

上場外食企業の財務データ分析 - 主な上場外食企業を調べてみた。

今回は趣向を変えて、上場している外食企業の財務データを分析してみました。吉野家とかココイチとかすかいらーくとかですね。 日本取引所のホームページから上場企業の財務データがわかるので、それを使いました。 こんな感じのデータです。これの通期決算…

県内総生産額と交通事故件数のデータの分析2 - R言語で分析。県内総生産額当りの事故件数は東京都が一番少なく、佐賀県が一番多い。

www.crosshyou.info の続きです。 まず、データがどんなだったか、summary関数で確認します。 47都道府県の10年間のデータです。 Prodが県内総生産額で、百万円単位です。 Acciが交通事故件数で、1件単位です。 Ratioが県内総生産額100万円当りの交通事故件…

県内総生産額と交通事故件数のデータの分析1- R言語で分析。交通事故は、県内総生産額10億円当り1.57件発生

政府統計の総合窓口、e-statのウェブページから、県別の県内総生産額と交通事故発生件数のデータを取得しました。 こんな感じのデータです。このデータをR言語を使って分析してみようと思います。 まず、read.csv関数でデータをR言語の読込みます。 str関数…

全国輸出入コンテナ貨物流動調査のデータの分析3 - R言語で主成分分析

www.crosshyou.info の続きです。 Rクックブック 作者: Paul Teetor,大橋真也,木下哲也 出版社/メーカー: オライリージャパン 発売日: 2011/12/22 メディア: 大型本 購入: 9人 クリック: 61回 この商品を含むブログ (13件) を見る 今回はこの本を参考にして…

全国輸出入コンテナ貨物流動調査のデータの分析2 - R言語のhist関数でヒストグラム、pairs関数で散布図マトリックス、cor関数で相関係数マトリックス

www.crosshyou.info の続きです。前回はデータファイルを整えるので終わってしまいました。 R言語のstr関数でデータフレームの構造を確認します。 ExPxとInPxがなぜか数値ではなく、ファクターとして取り込まれています。 数値データに変換してみましょう。 …

全国輸出入コンテナ貨物流動調査のデータの分析1 - データファイルを整えるのに苦労する。

いつものように、e-Stat:政府統計の総合窓口を見てみました。 いくつか新着情報がありました。この中で一番マニアックな感じのする、全国輸出入コンテナ貨物流動調査をクリックしてみました。 本調査は、我が国の貿易額の約4割を占める、とあります。コンテ…

OECDのIndstrial Productionのデータの分析 - R言語での実践例

今回は、OECDのデータを分析してみようと思います。 https://stats.oecd.org/ ここからいろいろデータを取得できるようです。 今回は2017年と2018年のIndustrial Production, 鉱工業生産の伸び率を分析してみます。 Excelにデータをダウンロードしたらこんな…

東証一部の規模別・業種別PERとPBRのデータの分析11 - 2013年、2014年と比べるとROEは高くなったがPERは低下している。

www.crosshyou.info の続きです。 まず、ls()関数で変数として今までどんな変数を作成してきたかを確認します。 dfで始まっているのはデータフレームですね。dfからdf8まで9種類あります。 初心に帰ってdf関数がどんなものか、見てみましょう。head関数で始…

植生自然度のデータ分析1 - 市街地の割合が一番高いのは大阪府、一番低いのは高知県。

今回はe-Stat(政府統計の総合窓口)から取得した、全国の植生自然度のデータを分析しようと思います。 これがe-Statのサイトの画像ですね。このデータをダウンロードすると、 こうなります。9行目は私が挿入した変数名です。 そもそも、植生自然度ってなんで…

人口の推移と株価の関係の分析4 - 埼玉県が人口増加率1位、秋田県が減少率1位。各都道府県の人口増加や男性比率、日本人比率の変化を調べる。

www.crosshyou.info の続きです。 今回は、人口の伸び率上位・下位、男性比率変化幅の上位・下位、日本人比率変化幅の上位・下位の国を調べようと思います。 まずは、作業用のデータがどんなだったか、確認します。R言語のsummary関数を使います。 Yaer1は19…

人口の推移と株価の関係の分析3- 株価と西暦、総人口、男性比率、日本人比率をR言語のlm関数で重回帰分析する。

www.crosshyou.info の続きです。 今回はメインタイトルどおり、人口の推移と株価の関係を分析してみようと思います。 まずは、全国の総人口と男性比率と日本人比率、この3つの説明変数と株価の関係を分析してみたいと思います。 まず、分析用のデータフレー…

東証一部の規模別・業種別PERとPBRのデータの分析10 - PERを利益、資産、時間軸で重回帰分析する

www.crosshyou.infoの続きです。 今回はPERを利益、資産、時間軸で重回帰分析したいと思います。 参考書籍は Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー: Wiley 発売日: 2014/11/24 メディア: ペーパーバック この商品…

人口の推移と株価の関係の分析2 - 神奈川県は男性比率が高く、長崎県は低い。東京都は外国人比が高く、徳島県は低い

www.crosshyou.info の続きです。 今回は各都道府県の男女比率、日本人比率を見てみようと思います。 まず、前回作成したワーキングデータ(wd)のサマリーを確認します。 summary関数です。 今回は、男女比率(M/F)と日本人比率(J/T)を計算して、大きい順、小…

人口の推移と株価の関係の分析1 - R言語でデータの整理(subset関数やmerge関数)

e-Stat(政府統計の総合窓口)のレイアウトが令和になって変更になりました。 今回は右下の「地域」をクリックしてみます。 クリックすると、上図のような画面になります。データ表示をクリックしてみます。 都道府県別の人口を選択して、データを表示します。…

読書記録 - 「統計でウソをつく法 - 数式を使わない統計学入門」

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス) 作者: ダレル・ハフ,高木秀玄 出版社/メーカー: 講談社 発売日: 1968/07/24 メディア: 新書 購入: 9人 クリック: 153回 この商品を含むブログ (130件) を見る 私が生まれる前に出版された本で…

東証一部の規模別・業種別PERとPBRのデータの分析9 - R言語で1社当たりのIncomeとNetAsset

www.crosshyou.info の続きです。 今回は1社当たりのIncomeとNetAssetの推移を調べてみます。まずは1社当たりのIncome, NetAssetの変数を作成します。 MedianとMeanの値が離れていますね。単位は億円なので、最大の赤字が865億円、最大の黒字が2576億円、平…

東証一部の規模別・業種別PERとPBRのデータの分析8 - R言語で時系列チャートを作成

www.crosshyou.info の続きです。 今回は、YearとMonthを合わせて、Timeという変数を作ろうと思います。 というのもstr関数でおおもとのデータフレーム、dfを確認すると、 となっていて、YearとMonthが別々になっているので、横軸を時間にして縦軸をPBRとか…

東証一部の規模別・業種別PERとPBRデータの分析7 - R言語でヒストグラムを描く

www.crosshyou.info の続きです。 今回は33業種別のデータで、各変数のヒストグラムを描いてみます。 head関数で基になるデータフレームの始めの15行を表示します。 33業種はLevelが5ですから、まずLevelが5だけのデータフレームを作成します。 まずは、Numb…

読書記録 - 「HOPE -- 都市・企業・市民による気候変動総力戦」

HOPE――都市・企業・市民による気候変動総力戦 作者: マイケル・ブルームバーグ,カール・ポープ 出版社/メーカー: ダイヤモンド社 発売日: 2018/10/18 メディア: Kindle版 この商品を含むブログを見る 気候変動に対応するには、国家だけでなく都市・企業…

国民経済計算四半期GDP速報データの分析6 - R言語で株価の騰落率とGDPデータの重回帰分析をしてみる。

www.crosshyou.info の続きです。 前回は、株価の騰落率とNetExpo(純輸出)で線形単回帰分析をしてみましたが、NetExpoだけでは株価の騰落率を説明することは難しいことがわかりました。そこで今回は、他の変数も加えて、重回帰分析をしてみようと思います。 …

国民経済計算四半期GDP速報データの分析5 - R言語で株価、株価の騰落率とGDPデータの相関を調べる。

www.crosshyou.info の続きです。 今回は、株価、株価の騰落率とGDPデータの相関係数を調べてみようと思います。 相関係数はcor関数でわかります。 soukan <- の行で、株価とGDPの各データの相関係数を計算しています。round関数で小数点以下3桁までにして…

国民経済計算四半期GDP速報データの分析4 - R言語で各変数のヒストグラムとグラフを作成する。

www.crosshyou.info の続きです。 前回まではGDPと株価しかみていませんでしたが、データには、民間最終消費支出や、民間企業設備など様々な変数がありますから、それらを見ていきましょう。 まずは、names関数で変数名を確認します。 MinShouhiは民間最終消…