www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2019-11-01から1ヶ月間の記事一覧

国立科学博物館の標本データベースの日本の鳥類の標本の分析3 - Mokuのデータが怪しいことに気が付いた。

www.crosshyou.info の続きです。 今回は、Moku(目), Zoku(属), Shu(種)について調べます。 まず、Mokuは何種類あるか、標本数の多いMokuは何か調べてみましょう。 levels関数とlevels関数でMokuの種類数を調べます。 Mokuは214種類ですね。どのMokuが一番多…

国立科学博物館の標本データベースの日本の鳥類の標本の分析2 - 月と日付のデータを整える。8月に採取された標本が一番少ない。

www.crosshyou.info の続きです。今日は月と日付のデータを整えます。 Monthを確認します。 空白、**, 20は明らかにおかしいですね。NAにします。空白は1番目、**は2番目、20は8番目です。 こうして1から12までにしました。これを文字列型にしてから数値…

国立科学博物館の標本データベースの日本の鳥類の標本の分析1 - メジロの標本、北海道の標本、1930年代の標本が一番多い。

国立科学博物館の標本データベースからCSVファイルをダウンロードできることを発見しましたので、データをダウンロードして遊んでみようと思います。 詳細検索(鳥類) | 標本・資料統合データベース から日本の標本を検索してみました。 こんなCSVファイルが…

内閣支持率のデータ分析2 - R言語のbarplot関数の練習。beside = TRUE/FALSE とlegend.text = TRUEが大事

www.crosshyou.info の続きです。 今回はbarplot関数の練習をしてみようと思います。 習うより慣れろの精神でいろいろやってみます。 まずはデータを確認します。 1列目は文字(ファクター)で、2、3、4列目が数値データですね。 まずは、barplot(df)とし…

内閣支持率のデータ分析1 - 各社で支持率は違うか、支持率の信頼区間をR言で調べる。

安倍晋三首相の在任日数が憲政史上最長になりました。 そこで今回は、各報道機関の世論調査、内閣支持率がどうなっているかを調べてみました。 こちらは、NHKの世論調査です。 http://www.nhk.or.jp/senkyo/shijiritsu/ 2019年11月8日から10日の調査で、1253…

乗用車ブランド通称名別順位のデータ分析4 - 日産とホンダの販売台数、順位に違いはあるか?

www.crosshyou.info の続きです。 tapply関数でメーカー別の販売台数を見てみましょう。 トヨタが204,628台でダントツですね。2位がホンダの63,507台、3位が日産の62,943台です。 メーカーごとの平均順位はどうでしょうか? トヨタが15.78で1位ですね。2位が…

乗用車ブランド通称名別順位のデータ分析3 - R言語でヒストグラムや箱ひげ図を作成する。1月と2月の販売台数をt.test関数、wilcox.test関数で検定。

www.crosshyou.info の続きです。 今回は販売台数をグラフにしてみましょう。 まずは、小さい順グラフ、ヒストグラム、箱ひげ図の3つのグラフを一度に作成する関数を作ります。 gpという名前の関数を作りました。 それでは販売台数をグラフにしてみます。 …

乗用車ブランド通称名別順位のデータ分析2 - R言語で自作関数を作成。標準偏差、標準誤差、変動係数、信頼区間などを算出。

www.crosshyou.info の続きです。 今回は標準偏差、標準誤差、変動係数などを計算する関数を作成してみます。 まずは、前回保存したCSVファイルを読み込んでsummary関数で様子を見てみます。 こうなりました。summary関数だと数値データは最小値、第1分位、…

乗用車ブランド通称名別順位のデータ分析1 - R言語のXMLパッケージのreadHTMLTable関数でWebから直接データを読み込む。

今回は、R言語のXMLパッケージのreadHTMLTable関数でWebの表形式のデータを直接読込んでみます。 参考図書は、Rクックブックです。 Rクックブック 作者: Paul Teetor,大橋真也,木下哲也 出版社/メーカー: オライリージャパン 発売日: 2011/12/22 メディア: …

都道府県別の凶悪犯認知件数の分析6 - R言語で県内総生産当りの凶悪犯認知件数を人口と可住地面積で回帰分析。

www.crosshyou.info の続きです。 今回は、県内総生産当りの凶悪犯認知件数を人口と可住地面積で回帰分析しようと思います。 まずは、県内総生産当りの凶悪犯認知件数を算出します。 avgGDPは百万円単位なので、百万をかけて1円当りの件数にしています。富山…

都道府県別の凶悪犯認知件数の分析5 - R言語で可住地面積当りの凶悪犯認知件数を人口と県内総生産で回帰分析。人口・県内総生産額の大きな県ほど件数は多い

www.crosshyou.info の続きです。 前回作成した、可住地面積10万ha当りの凶悪犯認知件数を人口と県内総生産で回帰分析してみます。 まずはplot関数で散布図を描いてみます。 右側の対数変換した後の散布図のほうが分析するにはよさそうですね。 県内総生産と…

都道府県別の凶悪犯認知件数の分析4 - R言語で可住地面積当りの凶悪犯認知件数を計算。度数分布表を出力する関数を作成。

www.crosshyou.info の続きです。 今回は可住地面積当りの凶悪犯認知件数を計算してみます。 10万ha当りの件数を算出しました。秋田県は8.4件、大阪府は780.5件です。100倍近い差がありますね。 グラフで分布をみてみます。 大きな値に外れ値がいっぱいある…