crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

データ分析

都道府県別の老人福祉費と児童福祉費の分析9 - R言語で、老人福祉費 / 児童福祉費 という比率を計算。沖縄県以外はどこも老人福祉費のほうが多い。

www.crosshyou.info の続きです。 今回は、老人福祉費 / 児童福祉費 という比率を計算してみます。 まず、老人福祉費と児童福祉が同じ都道府県の順番で並んでいるか確認します。 == で同じかどうかをテストしました。すべてTRUEなので同じですね。sumでTRUE…

都道府県別の老人福祉費と児童福祉費の分析8 - R言語で一人当り児童福祉費を重回帰分析。東京都を含めるか除外するかでモデルが違ってくる。

www.crosshyou.info の続きです。 今回は一人当りの児童福祉費(ChildpM)を重回帰分析します。 説明変数は対数をとった面積(logArea)と対数をとった県内総生産(logGDP)です。 まずは、一番複雑なモデルから。 logArea:logGDPの交差項は不要のようです。削除し…

都道府県別の老人福祉費と児童福祉費の分析7 - R言語で重回帰分析。一人当りの老人福祉費は面積が大きい県ほど多い。GDPの大きい県ほど少ない。

www.crosshyou.info の続きです。 今回は一人当りの老人福祉費を面積(対数をとったもの)と県内総生産(対数をとったもの)の二つの変数で回帰分析してみたいと思います。 まずは、それぞれの変数との散布図を描いてみます。 面積は関係なさそうですが、GDPは関…

日銀の短観データの分析6 - R言語で棒グラフと1標準誤差、信頼区間を表示する。

www.crosshyou.info の続きです。 今回は棒グラフと信頼区間を表示してみたいと思います。 Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー: Wiley 発売日: 2019/12/09 メディア: ペーパーバック この商品を含むブログを見る…

日銀の短観データの分析5 - R言語でANOVA。繊維や紙・パルプは景気が悪く、対事業所サービスや通信は景気がいい。

www.crosshyou.info の続きです。 今回の説明変数はIndus, 業種です。summary関数でどういう業種があるか見てみます。 33種類の業種があります。今回は前回までとは違ったアプローチでANOVAをやってみたいと思います。 いつものように参考図書は、 Statistic…

日銀の短観データの分析4- R言語でANOVA。中小企業は景況感は悪い。

www.crosshyou.info の続きです。 今回は、大企業、中堅企業、中小企業という企業規模の違い、Scaleをexplanatory variableにしてANOVAをしてみます。企業規模の違いで短観の数値に違いはあるでしょうか? まずは、グラフで様子を確認しましょう。 黒い点が…

日銀の短観データの分析3 - R言語でANOVA。製造業よりも非製造業のほうが景気はいいようだ。

www.crosshyou.info の続きです。今回もANOVAをします。今度は、Sector(製造業、非製造業、全産業)を説明変数にして、Value、短観の値を反応変数にします。 またグラフでSectorによって短観の値に違いがあるか見てみましょう。 黒い点が製造業で黒い水平線が…

日銀の短観データの分析2 - R言語でANOVA。最近と先行きに違いはある。先行きのほうが悲観的。

www.crosshyou.info の続きです。今回もANOVAです。explanatoly variables(説明変数)をType(最近、先行きの2値をとるカテゴリカル変数)にresponse variable(反応変数)はValue(短観の値)です。 まずは、前回と同じくグラフで見てみます。 黒い点が最近、赤い…

日銀の短観データの分析1 - R言語でANOVA。6月調査と9月調査に違いがあるとは言えない。

今回は先日発表された日銀の短観データを分析してみます。 日銀のウェブサイトからダウンロードしたファイルは、上のようなものでした。 これを こんな感じにデータを組みなおして、read.csv関数でR言語で読み込み、分析してみます。 summary関数でそれぞれ…

都道府県別の老人福祉費と児童福祉費の分析6 - R言語で回帰分析の続き。一人当りの老人福祉費と児童福祉を計算した。

www.crosshyou.info の続きです。 児童福祉費と人口は関係ありましたね。児童福祉費と面積はどうでしょうか? p-valueは0.1507なので有意ではないですね。面積は児童福祉費には関係ないようです。 では、県内総生産を見てみましょう。 p-valueが2.2e-16より…

都道府県別の老人福祉費と児童福祉費の分析5 - R言語で回帰分析をする。

www.crosshyou.info の続きです。 今回はR言語で回帰分析をします。老人福祉費または児童福祉を人口、面積、県内総生産の3つの変数で回帰分析します。事前の予想は、人口と県内総生産は関係あるけど、面積は関係ないんでは?と思います。 早速やってみます。…

都道府県別の老人福祉費と児童福祉費の分析4 -R言語で Variance(分散)を調べ、standard error(標準誤差)とconfidence interval(信頼区間)を求める。

www.crosshyou.info の続きです。 今回は、variance(分散)を調べます。上に画像のある、Michael J. CrawleyのStatistics An Introduction using Rを参考にします。 varianceはvar関数で簡単にわかります。 10年間平均の老人福祉の対数の分散は、 0.07579028…

都道府県別の老人福祉費と児童福祉費の分析3 - Central Tendency(代表値)を調べる。算術平均値、中央値、幾何平均値、調和平均値。

www.crosshyou.info の続きです。 今回は、老人福祉費と児童福祉費のCentral Dendencyを調べようと思います。 いつものように Michael J. Crawleyの Statistics An introduction using R を参考にします。 Statistics: An Introduction Using R 作者: Michae…

都道府県別の老人福祉費と児童福祉の分析2 - グラフにしてデータの分布形状を確認する。

www.crosshyou.info の続きです。前回は都道府県別の10年間の平均値をtapply関数を使って算出しました。 せっかくなので、グラフにしてどのようなデータ分布なのか見てみます。 まずは、いっぺんに三つのグラフを描く関数を作ります。 小さい順に並べたグラ…

都道府県別の老人福祉費と児童福祉費の分析1 - R言語で都道府県別の平均値を算出する。

今回は、都道府県別の老人福祉費と児童福祉費の分析をしてみようと思います。 データは、政府統計の総合窓口e-stat(www.e-stat.go.jp)から取得しました。 取得したデータは5つです。総人口、総面積、県内総生産額、老人福祉費、児童福祉費です。 ExcelのCSV…

台風の発生数と上陸数のデータの分析4 - 平均気温、台風発生数、台風上陸数で並び替え、と思ったら元のデータがダメだった。

www.crosshyou.info の続きです。 今回は、前回作成したデータフレームの各変数を大きい順、小さい順に並び替えましょう。 まずは、沖縄の平均気温の高い順に並び替えます。 Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー:…

台風の発生数と上陸数のデータの分析3 - 気温のデータと台風の発生数、上陸数のデータを一つのデータフレームにまとめる。

www.crosshyou.info の続きです。前回はNAを0に変換しました。 今回は、台風の上陸回数、発生回数をベクトルにします。 まず、現状のデータフレームがどういうふうなのかhead関数で見てみます。 HASSとJOURは1行目が1951年、2行目が1952年と横向きにデータが…

台風の発生数と上陸数のデータの分析1 - 気象庁からデータを取得して、R言語に読込む

今回は、気象庁のホームページ www.jma.go.jp から、台風の発生数、上陸数のデータを取得して分析しようと思います。 からデータをダウンロードしました。 台風の発生数、上陸数、那覇と東京の月別の平均気温を取得しました。 気温はこんなデータファイルで…

日経の経済指標からデータを取得して分析4 - R言語でロジスティック回帰分析、そしてドル円だけが残った。

www.crosshyou.info の続きです。 今回は日経平均の騰落を回帰分析したいと思います。ロジスティック回帰分析です。 まずは、日経平均の騰落を表すベクトルを作成します。 まず、vNikkの先頭にNAを追加したベクトル、xを作成しました。 これで、vNikk - x で…

日経の経済指標からデータを取得して分析3 - 前回の重回帰分析を修正。日経平均の値は、ドル円と消費支出と鉱工業生産で74%説明可能

www.crosshyou.info の続きです。というよりは修正です。 前回は、ドル円については、日経平均とラグが無いとして分析しましたが、よく考えたら9月1日時点では、9月末のドル円の値はわかってなくて、8月末の値しかわからないのだから、1か月ずらさないといけ…

日経の経済指標からデータを取得して分析2 - 日経平均をドル円・消費支出・鉱工業生産で重回帰分析

www.crosshyou.info の続きです。 最終的な目標は日経平均の値動きをドル円、消費支出、鉱工業生産で説明したい、ということですが、今回はその前段階として利用可能なデータの時点を合わせたいと思います。 どういうことかというと、9月1日の時点で、日経平…

日経の経済指標からデータを取得して分析1 - 日経平均・ドル円・消費支出・鉱工業生産のグラフ(箱ひげ図、ヒストグラム、散布図、小さい順、時系列)

vdata.nikkei.com 今回はこの、日経の経済指標ダッシュボードからデータを保存して分析してみようと思います。 たくさんデータがあるのですが、日経平均(Nikk)、ドル円相場(Yen)、消費支出(Cons)と鉱工業生産指数(IP)の4つを取得しました。最終的には、ドル…

都道府県別の教育用PC1台当りの生徒数の分析3 - PC1台当りの生徒数と人口・面積・生徒数は関連が無い。

www.crosshyou.info の続きです。 前回は、PC1台当りの生徒数は年度による違いは無いとわかりました。(2013年度と2015年度を比較しました。) 今回は都道府県別のPC1台当りの生徒数を反応変数にして、人口、面積、生徒数の3つの変数で重回帰分析をしてみます…

都道府県別の教育用PC1台当り生徒数の分析2 - 信頼区間95%の平均値を求める

www.crosshyou.info の続きです。 今回は Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー: Wiley 発売日: 2014/11/24 メディア: ペーパーバック この商品を含むブログを見る を参考にして、PC1台当りの生徒数の平均値と95%…

都道府県別の教育用PC1台当り生徒数の分析1 - 基本統計量。佐賀県は高校生一人にPC1台を達成。千葉県は9.3人にPC1台。

今回は都道府県別の教育用コンピュータ1台当りの生徒数を調べます。 政府統計の総合窓口e-Statからデータを取得します。 www.e-stat.go.jp がe-Statのウェブサイトです。 47都道府県を選択します。 総人口(人), 総面積(ha), 県内総生産(百万円), 教育用コン…

R言語で自動的にサマリー統計値を計算する関数を作ってみた。

R言語のsummary関数は便利なのですが、標準偏差や変動係数が算出されないことが不満でした。探せばそういう関数あるのかもしれないですが、関数を作る練習として、自作してみました。 # 自動でsummary関数、標準偏差、変動係数を出力する関数 jidou_sammary …

県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析3 - 課税所得を他の変数で重回帰分析する。

www.crosshyou.info の続きです。 今回は、課税所得伸び率を人口伸び率、面積伸び率、行政職員伸び率の3つの変数で重回帰分析をしてみたいと思います。 まずは、散布図を見てみます。plot関数ですね。 人口伸び率はかなり相関が強そうです。面積伸び率はなさ…

県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析2 - 東京都中央区の人口と所得の伸び率はすごい。滋賀県大津市は面積拡大。

www.crosshyou.info の続きです。今回は、2005年度から2015年度の変化率を調べてみようと思います。 まずは面積の伸びを調べます。 このように、2005年度の面積、2015年度の面積のベクトルを作成します。head関数ではじめの6つを表示しました。五十音順に並…

県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析1 - 神奈川県横浜市は大きい

県庁所在市・政令指定都市・東京都特別区の人口・面積・課税対象所得・一般行政職員人数の分析をします。 まずは、政府統計の総合窓口(www.s-stat.go.jp)からデータを取得します。 このように、特別区、県庁所在市、政令指定都市を指定します。74地域ありま…

都道府県別の国民医療費の分析3 - 人口密度を説明変数に加えて重回帰分析

www.crosshyou.info の続きです。 前回までの分析で、一人当りの医療費は、一人当り県内総生産がちいさいほど大きくなることがわかりました。今回は、人口密度を説明変数に加えて分析してみます。 まずは、上のように、平均人口密度を表す変数(avgMits)を作…