Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2018-10-01から1ヶ月間の記事一覧

消費者物価指数の分析3 - R言語のcor関数で相関係数を調べる

www.crosshyou.info に引き続き、消費者物価指数のデータで遊びたいと思います。 前回の分析で各変数の推移をグラフにしましたが、いろいろな動きがありました。 そこで、今回はR言語で「総合」の消費者物価指数と一番相関の高い、低い、無相関の変数は何か…

消費者物価指数の分析2 - R言語のplot関数でグラフを描く

www.crosshyou.info の続きです。前回は、消費者物価指数(年平均)のデータをR言語に読込ませ、平均値などの記述統計量を算出しました。前回作成したデータフレームは、下図のようなものでした。 このようなデータフレームですが、この中の変数でNAがある変数…

読書記録 - 「異常気象と地球温暖化 未来に何がまっているか」鬼頭昭雄 著 岩波新書

異常気象と地球温暖化――未来に何が待っているか (岩波新書) 作者: 鬼頭昭雄 出版社/メーカー: 岩波書店 発売日: 2015/03/21 メディア: 新書 この商品を含むブログ (2件) を見る 順不同で心に残っていることを書き記します。 異常気象は地球上のどこかの地域…

消費者物価指数の分析1 - R言語で最小値、最大値、平均値、中央値、標準偏差などの基本統計量を算出する。

今回は消費者物価指数のデータを使ってR言語での分析を練習しようと思います。 e-Stat(政府統計の総合窓口)からデータのファイルを取得します。 このなかの「年平均」のExcelファイルを開いてみました。 こういうファイルでした。このファイルをR言語に読込…

資金循環勘定(平成28年度)の分析2 - R言語で資産残高と負債残高のランキングを作成

www.crosshyou.info 今回は前回(上記の記事です)の続きで、資金循環勘定の分析をR言語でやってみます。 まずは、前回と同じくデータをread.csv関数でR言語に読みこみ、summary関数とhead関数でデータを表示します。 今回は資産残高ランキングを作成してみま…

資金循環勘定(平成28年度)の分析1 - R言語で基本統計量を算出

今回からは、資金循環勘定(平成28年度)のデータをR言語で分析してみようと思います。 統計局ホームページ/日本の統計 2018−第4章 通貨・資金循環 このサイトにある、 この4-5 資金循環勘定(エクセル:37KB)というファイルです。 実際のファイルはこんな感じ…

県民経済計算の分析7 - R言語でクロス表分析。経済規模、裕福さ、民間政府比率は関連性あり

前回のブログ www.crosshyou.info に続いて、今回はR言語でクロス表分析をしたいと思います。前回までで作成したデータフレームはこんなものでした。 成長性偏差値、経済規模偏差値、裕福さ偏差値、民間政府偏差値それぞれの変数の50以上の値を高成長、大規…

県民経済計算の分析6 - R言語でクラスター分析

今回は、県民経済計算のデータを使ってクラスター分析をしてみようと思います。 前回のブログは以下のリンクからご覧ください。 www.crosshyou.info まずは、R言語でデータを読み込んで、成長性などを偏差値で表したデータフレームを見てみます。 このような…

県民経済計算の分析5 - 成長性・規模・裕福さの偏差値を計算して総合スコアを計算する

今回は、前回のブログ、 www.crosshyou.info の続きで、R言語を使って成長性・規模、裕福さの3つの指標の偏差値を算出してそれらを合計した総合スコアを計算しようと思います。 まずは、前回作成したデータフレームを再掲します。 偏差値はどうやって計算す…

県民経済計算の分析4 - 成長性・規模・民間と政府のバランス・裕福さの上位都道府県はどこか?

今回は県民経済分析のデータを使って前回の続きをしていきます。 前回のブログ、 www.crosshyou.info では、新しく「対数名目」、「民間政府」、「対数一人当たり」という変数を作成しました。この変数と「対前年度増加率」のランキングを作成しましょう。 …

県民経済計算の分析3 - ヒストグラムを描く(hist関数)

今回は県民経済計算のデータのヒストグラムを描こうと思います。 前回はのブログはこちらです。 www.crosshyou.info まずは、CSVファイルに保存してあるデータをread.csvファイルに読込み、summary関数で平均値や中央値を表示します。 hist関数でヒストグラ…

県民経済計算の分析2 - ggplot関数のgeom_point関数で散布図を描く

今回は県民経済計算のデータを使ってR言語のggplot関数で散布図を描いてみたいと思います。 まずは、前回やったCSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数で平均値などを表示します。 続いてggplot関数を使うために、libra…

県民経済計算の分析1 - 基本統計量

今回は、都道府県別の県内総生産などのデータ分析をしてみたいと思います。 データは、「日本の統計」のウェブサイト、 www.stat.go.jpここから取得しました。 この3-15 県民経済計算 というファイルです。 実際のファイルがこれです。 これをR言語に読込ま…

国籍別在留外国人数の分析5 - 増減幅の上位・下位、増減率の上位・下位で二分してクロス表分析

今回は、国籍別在留外国人数のデータを使って、増減幅の上位・下位、増減率の上位・下位で二分したカテゴリカル変数を作成し、クロス表分析をしてみたいと思います。 前回までで、下図のようなR言語のデータフレームを作成しました。 平成26、27、28は国籍別…

国籍別在留外国人数の分析4 - 地域によって増減率に違いはあるだろうか?

今回は、国籍別在留外国人数のデータを使って、地域によって増減率に違いはあるだろうか?ということを検証したいと思います。 R言語にこんな形でデータフレームを作成しています。 地域としてはアジアが15か国、ヨーロッパが11か国と多いので、この2つの地…

国籍別在留外国人数の分析3 - 増減のデータで散布図を描く(plot関数、ggplot関数)

今回は、国籍別在留外国人数のデータを使い、増減の散布図を描いてみましょう。 前回の分析までで、下図のようなR言語のデータフレームを作成しました。 「地域」と「国籍」がカテゴリカル変数で、「平成26」「平成27」「平成28」がそれぞれの年の人数、「幅…

国籍別在留外国人数の分析2 - 増減のデータを作成する。人数が増えた国や地域、減った国や地域は?

今回は前回のデータを加工して増減を計算したいと思います。 まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読み込ませます。 summary関数で基本統計量を表示しています。平成26年、平成27年、平成28年の3年間のデータがありますので、増…

国籍別在留外国人数の分析1 - 基本統計量

今回は、国籍別在留外国人数のデータを分析してみようと思います。 データの元は、総務省統計局のホームページです。 ホーム > 統計データ > 日本の統計 > 本書の内容 > 第2章 人口・世帯 > 2-8 国籍別在留外国人数 です。 http://www.stat.go.jp/data/nihon…

各地の気温と降水量の分析6 - ggplot関数で散布図を描く

最近、もっとかっこいいグラフやかっこいい分析をしたいと思い、 Rではじめるデータサイエンス 作者: Hadley Wickham,Garrett Grolemund,大橋真也,黒川利明 出版社/メーカー: オライリージャパン 発売日: 2017/10/25 メディア: 単行本(ソフトカバー) この…

各地の気温と降水量の分析5 - 加工データでクラスター分析をしてみる。

前回は、原データでクラスター分析をしたので、今回は加工データでクラスター分析をしてみます。まずは、「日本の統計」にあった各地の気温と降水量のデータをread.csv関数でR言語に読込みます。 こんな感じのデータですね。このデータから、最大降水量や最…

読書記録 - 「戦国日本と大航海時代 秀吉・家康・政宗の外交戦略」平川新 著 中公新書

戦国日本と大航海時代 - 秀吉・家康・政宗の外交戦略 (中公新書 2481) 作者: 平川新 出版社/メーカー: 中央公論新社 発売日: 2018/04/18 メディア: 新書 この商品を含むブログ (5件) を見る 日本な何故、植民地にならなかったのか? それは、当時の日本がス…

各地の気温と降水量の分析4 - クラスター分析をしてみる。

今回は、各地の気温と降水量のデータを使ってクラスター分析をしてみたいと思います。 まずは、データをR言語に読込みます。read.csv関数ですね。 まずは、階層的クラスター分析をしてみます。 現場ですぐに使える! R言語プログラミング逆引き大全 350の極意…

各地の気温と降水量の分析3 - 寒暖差および、最大降水量と最小降水量の差を求める。

今回は各地の寒暖差及び、最大降水量の差を求めようと思います。 まずは、R言語にデータを読込みます。read.csv関数を使います。データを読み込んだら、summary関数でデータの基本記述統計値を表示しましょう。 前回は各地の平均気温、最高気温、最低気温、…

各地の気温と降水量の分析2 - 一番気温の高い都市・一番降水量の高い都市はどこか?

今回も前回に引き続き、「日本の統計」の各地の気温と降水量のデータを使って、R言語の操作の練習をします。 まずは、read.csv関数でCSVファイルに保存してあるデータを読込みます。そして、それをsummary関数で基本統計量を算出します。 このsummary関数の…

各地の気温と降水量の分析1 - 基本統計量(summary関数, apply関数, sd関数, mean関数)

いつものように、e-Stat(政府統計の総合窓口)のウェブサイトを見ていたら、総務省統計局のホームページに迷い込んで、「日本の統計」というページにアクセスしました。 こういう画面です。総務省統計局のホームページから、「統計データ」>>> 「日本の統計」…

生産者の米穀在庫等調査の分析3 - 全国平均よりも多い・少ないで二分してクロス表分析をしてみる

今回は、生産者の米穀在庫調査のデータを、全国平均よりも多い・少ないで二つに分けてクロス表分析をしてみたいと思います。まずは、read.csv関数でCSVファイルに保存してあるデータを読込みます。summary関数で要約統計量も表示してみましょう。 head関数で…

生産者の米穀在庫等調査の分析2 - 飯用で消費する比率の高い都道府県は?

今回は、前回に引き続き、生産者の米穀在庫等調査のデータの分析をします。前回の調査で、長崎県の農家は飯用で消費、つまり自分で消費してしまう量が多いことがわかりました。そこで今回は、飯用で消費する量と販売する量比率を各都道府県で計算したいと思…