データ分析
Bing Image Creator から作成:Clean River www.crosshyou.info このポストは上のポストの続きです。 前回の分析では、都道府県別で見たとき、男性の入職者数と女性の入職者数には違いがある、ということがわかりました。 今回は、年によって入職者数に違い…
UnsplashのAlexander Sinnが撮影した写真 www.crosshyou.info の続きです。前回は女性の入職者数と男性の入職者数の分布状況をヒストグラムにしてみました。ヒストグラムの分布形状は女性と男性で違いがあるようには見えませんでした。 今回はこれを、Rを使…
UnsplashのSigmundが撮影した写真 www.crosshyou.info の続きです。 前回はCSVファイルにあるデータをRに読み込ませて、分析しやすいようにデータフレームを整えました。 今回はデータをグラフにしてみます。 まず、total(全体の入職者数)をヒストグラムにし…
Bing Image Creator から作成 今回は、都道府県別の雇用動向調査のデータを分析します。 政府統計の総合窓口(e-stat)のホームページからデータをダウンロードします。 入職者のところをクリックしてみます。 性、都道府県、職歴、年齢別入職者数のDBのところ…
UnsplashのJan Cantyが撮影した写真 www.crosshyou.info 今回は、Rで階層的クラスタリングをしてみます。 R言語でクラスタリングしてみた - Qiita を参考にしています。 まずは、クラスリング用のマトリックスオブジェクトを作成します。 chg: 病院数の変化…
UnsplashのKwang Mathurosemontriが撮影した写真 www.crosshyou.info 今回は、per_chg: 人口10万人当たりの病院数の変化をper1999: 1999年の人口10万人当たりの病院数と、y1999: 1999年の病院数で回帰分析をしてみましょう。 まずは、lm()関数で回帰分析して…
UnsplashのAhmed Zayanが撮影した写真 www.crosshyou.info の続きです。 今回は1999年の人口10万人当たりの病院数と2019年の人口10万人当たりの病院数を比べてみましょう。 1999年の人口10万人当たりの病院数を求めるためには、1999年の都道府県別の人口のデ…
UnsplashのFlorentina Tilvicが撮影した写真 www.crosshyou.info 今回は、病院数と人口10万人当たりの病院数の関係性をみてみましょう。 まず、散布図を描きます。 ggplot() + geom_point()関数で散布図を作成しました。 あんまり関係なさそうです。 今回は …
UnsplashのBob Brewerが撮影した写真 www.crosshyou.info 前回は、cor.test()関数を使って病院の数の変化幅と、開始年の病院の数の相関を検定しました。結果は、相関係数は-0.725と負の強い相関があり、95%信頼区間は-0.838 ~ -0.553でした。 今回は、infer…
UnsplashのJoseph Chanが撮影した写真 www.crosshyou.info の続きです。 前回は、CSVファイルのデータをRのread_csv()関数で読み込み、summary()関数で平均値などの統計値を見ました。 1999年から病院の数は減り続けていることがわかりました。 そして、病院…
Unsplashのaboodi vesakaranが撮影した写真 今回は都道府県別の医療施設調査のデータを分析してみます。 政府統計の総合窓口(www.e-stat.go.jp)のウェブサイトからCSVファイルをダウンロードしました。 このようなCSVファイルです。年ごとの病院数と、2019年…
UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info の続きです。 前回は、Rのlm()関数で線形回帰分析をしました。そして、そのモデルはHeteroskedasticityだとわかりました。このときの対処方法は、ひとつは、Heteroskedasticity Robustな標…
UnsplashのEugene Golovesovが撮影した写真 www.crosshyou.info の続きです。 今回は、Rで回帰分析をしてみたいと思います。 被説明変数を gdp : 県内総生産額にして、説明変数を num_jin, sta_num, sal_sta, inp_num, out_inp, add_staにしてみます。 まず…
UnsplashのMarjolein vVが撮影した写真 www.crosshyou.info の続きです。 前回はクラスタリング分析をしたのですが、少し気になる結果になりました。 それは、 このように、inp_numの値ではっきりとグループが分かれたことです。 考えてみると、クラスタリン…
UnsplashのKatie Aziが撮影した写真 www.crosshyou.info の続きです。 今回は、クラスタリング分析をしてみます。 まず、クラスタリング分析をするためのマトリックスオブジェクトを作成します。 今回は、num_jin : 人口当たりの事業所の数、sta_num : 事業…
UnsplashのAnthony DELANOIXが撮影した写真 www.crosshyou.info の続きです。 引き続き、各変数をグラフにしていきます。まずは、input : 原材料使用額(百万円単位)です。 summary()関数で基本統計値を確認します。 一番少ないところは、3434億円、一番多い…
UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info 今回のブログは前回の続きです。前回はCSVファイルのデータをRに読み込ませました。 それでは、一つ一つの変数を詳しくみていきましょう。 まずは、num: 事業所の数です。summary()関数で基…
UnsplashのOpal Siegalが撮影した写真 今回からしばらくは、都道府県別の工業統計調査のデータを分析してみたいと思います。 データは、政府統計の総合窓口、e-stat.go.jp から取得します。 こんな感じのデータです。 これをCSVファイルに出力します。 この…
UnsplashのRap Dela Reaが撮影した写真 www.crosshyou.info の続きです。 今回は、Rで階層的クラスタリング分析をしてみます。 まず、クラスタリング分析をするためのデータフレームを用意します。 setaiの種類を総数だけにして、l_shoyu, l_noshoyu, l_hoka…
UnsplashのAlfons Moralesが撮影した写真 www.crosshyou.info の続きです。前回は2つの変数どうしの相関係数を調べて、信頼区間をcor.test()関数とブートストラップ法で算出しました。 今回は、回帰分析をしてみようと思います。 回帰分析の非説明変数は、l…
Unsplashの2H Mediaが撮影した写真 www.crosshyou.info の続きです。 前回は、各変数の上位と下位の都道府県を見てみました。 今回は2つの変数間の相関係数について見てみます。 まず。データフレームを世帯の種類が「総数」だけにします。世帯の種類には注…
UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info の続きです。 今回は、各変数のランキングを見てみようと思います。 まずは、totalのランキングです。setaiの種類を「総数」だけに絞ってランキングします。 東京都、大阪府、神奈川県、愛…
UnsplashのShana Van Roosbroekが撮影した写真 www.crosshyou.info の続きです。 前回はそれぞれの変数の分布を見るために、ヒストグラムを作成しました。 今回は2つの変数の関係性を見るために、散布図を描いてみます。 まず、l_totalとshotokuをみてみま…
UnsplashのGuillaume Chabrolが撮影した写真 www.crosshyou.info の続きです。 前回はデータのCSVファイルをRにインポートしました。 まず、skimrパッケージのskim()関数で各変数の基本統計量を一覧します。 282行、10列のデータフレームで、文字列型の変数…
UnsplashのJasmin Maagが撮影した写真 今回は、都道府県別の世帯土地統計のデータを分析してみようと思います。 政府統計の総合窓口(www.e-stat.go.jp)からデータを取得します。 たくさんデータセットがありましたが、今回は一番上の「世帯人員、土地の所有…
UnsplashのYouSsef NaDramが撮影した写真 www.crosshyou.info の続きです。前回は、l_total: リフォーム・リニューアルの金額の自然対数値を被説明変数、l_shotoku23: 県民1人当たり所得の自然対数値、l_total_prev: 前年のl_total、yearを説明変数にして回…
UnsplashのArham Jainが撮影した写真 www.crosshyou.info の続きです。前回は、l_total: 建築物リフォーム・リニューアルの金額の自然対数値をl_shotoku23: 県民1人当たり所得とyear: 調査年度の2つの説明変数で回帰分析してみました。 今回は、前年度のl_to…
UnsplashのRedd Fが撮影した写真 www.crosshyou.info の続きです。 今回は、l_total: リフォーム・リニューアルの金額の対数変換値値をl_shotoku23: 平成23年基準の県民1人当たり所得の対数変換値で回帰分析してみます。1人当たり所得の所得が大きいほど、リ…
UnsplashのLeonid Antsiferovが撮影した写真 www.crosshyou.info の続きです。引き続き、caretパッケージでratioを予測するモデルを作成していきます。 まずは、linear regression modelで、もう少し複雑なモデルにしてみます。 l_totalの2乗項と、l_total x…
UnsplashのDiego PHが撮影した写真 www.crosshyou.info 前回は、l_totalを2016年度、2017年度、2018年度で回帰分析してみました。理論ベースでもbootstrapでのシミュレーションベースでも、年度によってl_totalの平均値には違いがあることが確認できました。…