Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2019-05-01から1ヶ月間の記事一覧

県内総生産額と交通事故件数のデータの分析1- R言語で分析。交通事故は、県内総生産額10億円当り1.57件発生

政府統計の総合窓口、e-statのウェブページから、県別の県内総生産額と交通事故発生件数のデータを取得しました。 こんな感じのデータです。このデータをR言語を使って分析してみようと思います。 まず、read.csv関数でデータをR言語の読込みます。 str関数…

全国輸出入コンテナ貨物流動調査のデータの分析3 - R言語で主成分分析

www.crosshyou.info の続きです。 Rクックブック 作者: Paul Teetor,大橋真也,木下哲也 出版社/メーカー: オライリージャパン 発売日: 2011/12/22 メディア: 大型本 購入: 9人 クリック: 61回 この商品を含むブログ (13件) を見る 今回はこの本を参考にして…

全国輸出入コンテナ貨物流動調査のデータの分析2 - R言語のhist関数でヒストグラム、pairs関数で散布図マトリックス、cor関数で相関係数マトリックス

www.crosshyou.info の続きです。前回はデータファイルを整えるので終わってしまいました。 R言語のstr関数でデータフレームの構造を確認します。 ExPxとInPxがなぜか数値ではなく、ファクターとして取り込まれています。 数値データに変換してみましょう。 …

全国輸出入コンテナ貨物流動調査のデータの分析1 - データファイルを整えるのに苦労する。

いつものように、e-Stat:政府統計の総合窓口を見てみました。 いくつか新着情報がありました。この中で一番マニアックな感じのする、全国輸出入コンテナ貨物流動調査をクリックしてみました。 本調査は、我が国の貿易額の約4割を占める、とあります。コンテ…

OECDのIndstrial Productionのデータの分析 - R言語での実践例

今回は、OECDのデータを分析してみようと思います。 https://stats.oecd.org/ ここからいろいろデータを取得できるようです。 今回は2017年と2018年のIndustrial Production, 鉱工業生産の伸び率を分析してみます。 Excelにデータをダウンロードしたらこんな…

東証一部の規模別・業種別PERとPBRのデータの分析11 - 2013年、2014年と比べるとROEは高くなったがPERは低下している。

www.crosshyou.info の続きです。 まず、ls()関数で変数として今までどんな変数を作成してきたかを確認します。 dfで始まっているのはデータフレームですね。dfからdf8まで9種類あります。 初心に帰ってdf関数がどんなものか、見てみましょう。head関数で始…

植生自然度のデータ分析1 - 市街地の割合が一番高いのは大阪府、一番低いのは高知県。

今回はe-Stat(政府統計の総合窓口)から取得した、全国の植生自然度のデータを分析しようと思います。 これがe-Statのサイトの画像ですね。このデータをダウンロードすると、 こうなります。9行目は私が挿入した変数名です。 そもそも、植生自然度ってなんで…

人口の推移と株価の関係の分析4 - 埼玉県が人口増加率1位、秋田県が減少率1位。各都道府県の人口増加や男性比率、日本人比率の変化を調べる。

www.crosshyou.info の続きです。 今回は、人口の伸び率上位・下位、男性比率変化幅の上位・下位、日本人比率変化幅の上位・下位の国を調べようと思います。 まずは、作業用のデータがどんなだったか、確認します。R言語のsummary関数を使います。 Yaer1は19…

人口の推移と株価の関係の分析3- 株価と西暦、総人口、男性比率、日本人比率をR言語のlm関数で重回帰分析する。

www.crosshyou.info の続きです。 今回はメインタイトルどおり、人口の推移と株価の関係を分析してみようと思います。 まずは、全国の総人口と男性比率と日本人比率、この3つの説明変数と株価の関係を分析してみたいと思います。 まず、分析用のデータフレー…

東証一部の規模別・業種別PERとPBRのデータの分析10 - PERを利益、資産、時間軸で重回帰分析する

www.crosshyou.infoの続きです。 今回はPERを利益、資産、時間軸で重回帰分析したいと思います。 参考書籍は Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー: Wiley 発売日: 2014/11/24 メディア: ペーパーバック この商品…

人口の推移と株価の関係の分析2 - 神奈川県は男性比率が高く、長崎県は低い。東京都は外国人比が高く、徳島県は低い

www.crosshyou.info の続きです。 今回は各都道府県の男女比率、日本人比率を見てみようと思います。 まず、前回作成したワーキングデータ(wd)のサマリーを確認します。 summary関数です。 今回は、男女比率(M/F)と日本人比率(J/T)を計算して、大きい順、小…

人口の推移と株価の関係の分析1 - R言語でデータの整理(subset関数やmerge関数)

e-Stat(政府統計の総合窓口)のレイアウトが令和になって変更になりました。 今回は右下の「地域」をクリックしてみます。 クリックすると、上図のような画面になります。データ表示をクリックしてみます。 都道府県別の人口を選択して、データを表示します。…

読書記録 - 「統計でウソをつく法 - 数式を使わない統計学入門」

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス) 作者: ダレル・ハフ,高木秀玄 出版社/メーカー: 講談社 発売日: 1968/07/24 メディア: 新書 購入: 9人 クリック: 153回 この商品を含むブログ (130件) を見る 私が生まれる前に出版された本で…

東証一部の規模別・業種別PERとPBRのデータの分析9 - R言語で1社当たりのIncomeとNetAsset

www.crosshyou.info の続きです。 今回は1社当たりのIncomeとNetAssetの推移を調べてみます。まずは1社当たりのIncome, NetAssetの変数を作成します。 MedianとMeanの値が離れていますね。単位は億円なので、最大の赤字が865億円、最大の黒字が2576億円、平…