2019-10-01から1ヶ月間の記事一覧
www.crosshyou.info の続きです。 今回は、ファイ係数を計算する関数を作ってみます。 実は、 www.crosshyou.info のときにも関数を作ってみたのですが、何故かエラーになったんです。 そのとき作った関数が これです。 そして、この関数を実行したら、 と「…
www.crosshyou.info の続きです。 今回は対数値のavgArea, avgGDPで回帰分析してみます。 log(avgArea):log(avgGDP)の項目はいらないですね。削除します。 model2を採用します。 I(log(avgGDP)^2)はいらないですね。 model3を採用します。 I(log(avgArea)^2)…
www.crosshyou.info の続きです。 今回は、人口10万人当りの凶悪犯認知件数を算出して、これを可住地面積と県内総生産額で回帰分析してみます。 大阪府は人口10万人当りの件数でも一番多いですね。 一番少ないのは山形県です。 グラフにしてみます。 大阪府…
今回は都道府県別の凶悪犯認知件数を分析します。 e-stat, 政府統計の総合窓口からデータを取得しました。 説明変数として、総人口、可住地面積、県内総生産額も一緒に取得しました。 このようなExcelファイルを作成しました。これをread.csv関数でR言語に読…
www.crosshyou.info の続きです。 今回は勝利数を引き分け数で回帰分析してみます。 引き分け数が多いチームほど勝利数が多ければ、引き分けが多いのは粘り強さの証になりますし、逆に引き分けが多いチームほど勝利数が少なければ、引き分けが多いのは勝ちき…
www.crosshyou.info の続きです。 今回は 2 x 2 のクロス表で関連性の強さを見る指標、ファイ係数を計算しようと思います。 bellcurve.jpこのサイトに このように計算式が載っていました。これを使って計算します。 まずは、Aクラス・Bクラス x セリーグ・パ…
www.crosshyou.info の続きです。 今回はクロス表を作って、カイ二乗検定をしてみます。 勝利数を Aクラス・Bクラス x セリーグ・パリーグ、 Aクラス・Bクラス x 関東・非関東 セリーグ・パリーグ x 関東・非関東 この3つのクロス表で分類してカイ二乗検定…
www.crosshyou.info の続きです。 前回は、セリーグ、パリーグで勝利数の平均値に有意な違いは無いことがわかりました。今回は、関東の球団かそうじゃないか、AクラスかBクラスかで勝利数に違いがあるかを調べます。 var.test関数でvarianceが同じかどうか確…
今回はプロ野球の勝敗データを分析してみようと思います。 npb.jpこのサイトにあった の画像にある勝敗データを使おうと思います。 まず、Excelにデータを転記しました。 関東にある球団か、そうでないかという変数、Kantouと各リーグ上位をAクラス、下位をB…
www.crosshyou.info 今回は前回の続きで、こんどは人口、面積、県内総生産の対数値、logPop, logArea, logGDPで回帰分析をしてみたいと思います。前回は北海道の面積が他と比べて圧倒的に大きかったので、その影響が大きく出ていました。今回はどうでしょう…
www.crosshyou.info の続きです。 今回は、老人福祉費 / 児童福祉費 という比率を計算してみます。 まず、老人福祉費と児童福祉が同じ都道府県の順番で並んでいるか確認します。 == で同じかどうかをテストしました。すべてTRUEなので同じですね。sumでTRUE…
www.crosshyou.info の続きです。 今回は一人当りの児童福祉費(ChildpM)を重回帰分析します。 説明変数は対数をとった面積(logArea)と対数をとった県内総生産(logGDP)です。 まずは、一番複雑なモデルから。 logArea:logGDPの交差項は不要のようです。削除し…
www.crosshyou.info の続きです。 今回は一人当りの老人福祉費を面積(対数をとったもの)と県内総生産(対数をとったもの)の二つの変数で回帰分析してみたいと思います。 まずは、それぞれの変数との散布図を描いてみます。 面積は関係なさそうですが、GDPは関…
www.crosshyou.info の続きです。 今回は棒グラフと信頼区間を表示してみたいと思います。 Statistics: An Introduction Using R 作者: Michael J. Crawley 出版社/メーカー: Wiley 発売日: 2019/12/09 メディア: ペーパーバック この商品を含むブログを見る…
www.crosshyou.info の続きです。 今回の説明変数はIndus, 業種です。summary関数でどういう業種があるか見てみます。 33種類の業種があります。今回は前回までとは違ったアプローチでANOVAをやってみたいと思います。 いつものように参考図書は、 Statistic…
www.crosshyou.info の続きです。 今回は、大企業、中堅企業、中小企業という企業規模の違い、Scaleをexplanatory variableにしてANOVAをしてみます。企業規模の違いで短観の数値に違いはあるでしょうか? まずは、グラフで様子を確認しましょう。 黒い点が…
www.crosshyou.info の続きです。今回もANOVAをします。今度は、Sector(製造業、非製造業、全産業)を説明変数にして、Value、短観の値を反応変数にします。 またグラフでSectorによって短観の値に違いがあるか見てみましょう。 黒い点が製造業で黒い水平線が…
www.crosshyou.info の続きです。今回もANOVAです。explanatoly variables(説明変数)をType(最近、先行きの2値をとるカテゴリカル変数)にresponse variable(反応変数)はValue(短観の値)です。 まずは、前回と同じくグラフで見てみます。 黒い点が最近、赤い…
今回は先日発表された日銀の短観データを分析してみます。 日銀のウェブサイトからダウンロードしたファイルは、上のようなものでした。 これを こんな感じにデータを組みなおして、read.csv関数でR言語で読み込み、分析してみます。 summary関数でそれぞれ…
www.crosshyou.info の続きです。 児童福祉費と人口は関係ありましたね。児童福祉費と面積はどうでしょうか? p-valueは0.1507なので有意ではないですね。面積は児童福祉費には関係ないようです。 では、県内総生産を見てみましょう。 p-valueが2.2e-16より…
www.crosshyou.info の続きです。 今回はR言語で回帰分析をします。老人福祉費または児童福祉を人口、面積、県内総生産の3つの変数で回帰分析します。事前の予想は、人口と県内総生産は関係あるけど、面積は関係ないんでは?と思います。 早速やってみます。…
www.crosshyou.info の続きです。 今回は、variance(分散)を調べます。上に画像のある、Michael J. CrawleyのStatistics An Introduction using Rを参考にします。 varianceはvar関数で簡単にわかります。 10年間平均の老人福祉の対数の分散は、 0.07579028…