www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2023-01-01から1年間の記事一覧

OECD Adult education level data analysis 4 - Making a scatter plot using ggplot() + geom() function with R

UnsplashのSergey Leont'evが撮影した写真 www.crosshyou.info This post is following of the above post. In this post, let's see relationship between two variables. First, let's see correlations. I use cor() function to see correlation. TRY an…

読書記録 - 「入門 環境経済学 新版-脱炭素時代の課題と最適解」 有村 俊秀、日引 聡 著 中公新書

入門 環境経済学 新版-脱炭素時代の課題と最適解 (中公新書 2751) 作者:有村 俊秀,日引 聡 中央公論新社 Amazon この本は第一部と第二部に分かれていて、第一部は環境経済学の理論的な入門、第二部は現在の日本や世界の環境規制や環境税、排出量取引制度など…

OECD Adult education level data analysis 3 - using ggplot() + geom_boxplot() function to see categorical variable and numerical variable relationship

UnsplashのJean Vellaが撮影した写真 www.crosshyou.info This post is following of the above post.I made histograms in the previous post, in this post, I will make another type of graphs, boxplot. Let's start wtih LOCATION and TRY. I see RUS,…

OECD Adult education level data analysis 2 - calculate summary statistics and making histograms using R

UnsplashのS. Tsuchiyaが撮影した写真 www.crosshyou.info This post is following of the above post. In the above post, I made a data frame to work with. Let's check each variable names and it's explanations. BUPSRY: Below upper secondary, in …

OECD Adult education level data analysis 1 - Importing CSV file into R using read_CSV() and making a data frame to analyze.

UnsplashのWeiye Tanが撮影した写真 In this post, I will analyze OECD Adult education level data. First, I downloaded CSV file from OECD web site.{Education attainment - Adult education level - OECD Data} It is like above screen-shot. I alos…

都道府県別の世帯土地統計のデータの分析7 - Rのdist()関数、hclust()関数、plot()関数、cutree()関数で階層的クラスタリング分析をする。

UnsplashのRap Dela Reaが撮影した写真 www.crosshyou.info の続きです。 今回は、Rで階層的クラスタリング分析をしてみます。 まず、クラスタリング分析をするためのデータフレームを用意します。 setaiの種類を総数だけにして、l_shoyu, l_noshoyu, l_hoka…

都道府県別の世帯土地統計のデータの分析6 - Rで回帰分析。所得の大きいところほど土地の所有世帯数は多い。

UnsplashのAlfons Moralesが撮影した写真 www.crosshyou.info の続きです。前回は2つの変数どうしの相関係数を調べて、信頼区間をcor.test()関数とブートストラップ法で算出しました。 今回は、回帰分析をしてみようと思います。 回帰分析の非説明変数は、l…

都道府県別の世帯土地統計のデータの分析5 - Rのcor.test()関数とブートストラップ法で相関係数の信頼区間を調べる

Unsplashの2H Mediaが撮影した写真 www.crosshyou.info の続きです。 前回は、各変数の上位と下位の都道府県を見てみました。 今回は2つの変数間の相関係数について見てみます。 まず。データフレームを世帯の種類が「総数」だけにします。世帯の種類には注…

都道府県別の世帯土地統計のデータの分析4 - Rのfilter()関数や、select()関数でデータフレームを絞り込み、arrange()関数でデータフレームを並び替える。

UnsplashのWolfgang Hasselmannが撮影した写真 www.crosshyou.info の続きです。 今回は、各変数のランキングを見てみようと思います。 まずは、totalのランキングです。setaiの種類を「総数」だけに絞ってランキングします。 東京都、大阪府、神奈川県、愛…

読書記録 - 「アリストテレスの哲学」 中畑 正志 著 岩波新書

アリストテレスの哲学 (岩波新書) 作者:中畑 正志 岩波書店 Amazon アリストテレスは倫理学や形而上学やなどの始まりの人です。 アリストテレス哲学の入門書という本ですが、内容は難しく、雰囲気を感じたぐらいでした。 印象に残った言葉は「われわれにとっ…

都道府県別の世帯土地統計のデータの分析3 - Rのggplot() + geom_point()関数で、一人当たりの県民所得と土地の所有世帯数の散布図を描く。

UnsplashのShana Van Roosbroekが撮影した写真 www.crosshyou.info の続きです。 前回はそれぞれの変数の分布を見るために、ヒストグラムを作成しました。 今回は2つの変数の関係性を見るために、散布図を描いてみます。 まず、l_totalとshotokuをみてみま…

都道府県別の世帯土地統計のデータの分析2 - Rのggplot() + geom_histogram()関数で各変数のヒストグラムを描く。

UnsplashのGuillaume Chabrolが撮影した写真 www.crosshyou.info の続きです。 前回はデータのCSVファイルをRにインポートしました。 まず、skimrパッケージのskim()関数で各変数の基本統計量を一覧します。 282行、10列のデータフレームで、文字列型の変数…

都道府県別の世帯土地統計のデータの分析1 - Rのread_csv()関数でCSVファイルを読み込み、inner_join()関数でデータフレームを統合する。

UnsplashのJasmin Maagが撮影した写真 今回は、都道府県別の世帯土地統計のデータを分析してみようと思います。 政府統計の総合窓口(www.e-stat.go.jp)からデータを取得します。 たくさんデータセットがありましたが、今回は一番上の「世帯人員、土地の所有…

読書記録 - 「デジタル化する新興国 先進国を超えるか、監視社会の到来か」 伊藤 亜聖 著 中公新書

デジタル化する新興国 先進国を超えるか、監視社会の到来か (中公新書) 作者:伊藤亜聖 中央公論新社 Amazon 中国、インド、東南アジア、アフリカの新興国を中心に、これらの国々のデジタル社会化の様子を描いています。 この本のタイトル(先進国を超えるか、…

OECD Tourism flows data analysis 7 - regression analysis with infer package of R

UnsplashのAlexander Cifuentesが撮影した写真 www.crosshyou.info This post is following of above post. In this post, I will do cross sectional regression analysis using infer package. Fisrt, I select one year for cross sectional regression. …

OECD Tourism flows data analysis 6 - Testing for serial correlation of the error term using R

UnsplashのBob Brewerが撮影した写真 www.crosshyou.info This post is following of the above post. By previous posts, I made 6 models. These models are time series regression model. So, I would like to check whether there are serial correlati…

OECD Tourism flows data analysis 5 - regression with differenced data using R

Unsplashのguy stevensが撮影した写真 www.crosshyou.info This psot is following of above post.In the previous post, I regress acc_nights, inter_arr and inter_dep on per_capita and trend term for Japan tourism flow data. In this post, I will …

OECD Tourism flows data analysis 4 - Time series regression for Japan tourism data with R.

UnsplashのHan Chenxuが撮影した写真 www.crosshyou.info This post is floowing of the above post.In the above post, I find year 2020 and 2021 have COVID-19 effect and each locations has their own characteristics. So I will focus a few locatio…

OECD Tourism flows data analysis 3 - Boxplots and Scatter Plots using R.

UnsplashのQuang Nguyen Vinhが撮影した写真 www.crosshyou.info This post is floowing of above post.In this post, I will draw some graphs to see relationship of two variables. Fisrt, I see per capita and location with boxplots. I see SAU, AUS…

読書記録 - 「幸福の増税論 - 財政は誰のために」 井手 英策 著 岩波新書

幸福の増税論-財政はだれのために (岩波新書) 作者:井手 英策 岩波書店 Amazon この本の第4章のタイトルは、「貯蓄ゼロでも不安ゼロの社会」です。 このタイトル通りに日本が「貯蓄ゼロでも不安ゼロの社会」になればいいなと思います。 教育、医療、子育て…

OECD Tourism flows data analysis 2 - Data wrangling and one variable visualization with R.

Unsplashの2H Mediaが撮影した写真 www.crosshyou.info This post is following of the above post. I make ACC_NIGHTS only data frame with filter() function in R. Next, I make INTER_ARR only data frame. I make INTER_DEP only data frame. Then, I …

OECD Tourism flows data analysis 1 - Load CSV data into R.

UnsplashのErik Knoefが撮影した写真 In this post, I will analyze OECD Tourism flows data analysis. I download CSV file from the OECD website. I also downladed GDP per capita data from OECD web site. I use R for data analysis. First, I load …

読書記録 - 「肝臓のはなし - 基礎知識から病への対処まで」 竹原 徹郎 著 中公新書

肝臓のはなし-基礎知識から病への対処まで (中公新書, 2689) 作者:竹原 徹郎 中央公論新社 Amazon タイトルどおりに、古代中国やギリシャでは肝臓がどのように捉えられていたか、から始まり、肝臓の病気の対処方法までが書かれていました。 肝臓は人体の中で…

都道府県別の建築物リフォーム・リニューアル調査のデータ分析9 - Rでパネルデータ分析

UnsplashのYouSsef NaDramが撮影した写真 www.crosshyou.info の続きです。前回は、l_total: リフォーム・リニューアルの金額の自然対数値を被説明変数、l_shotoku23: 県民1人当たり所得の自然対数値、l_total_prev: 前年のl_total、yearを説明変数にして回…

都道府県別の建築物リフォーム・リニューアル調査のデータ分析8 - 前年の被説明変数値を含めての回帰分析すると、結果は全く違った結果になった。

UnsplashのArham Jainが撮影した写真 www.crosshyou.info の続きです。前回は、l_total: 建築物リフォーム・リニューアルの金額の自然対数値をl_shotoku23: 県民1人当たり所得とyear: 調査年度の2つの説明変数で回帰分析してみました。 今回は、前年度のl_to…

読書記録 - 「景観から読む日本の歴史」 金田章裕 著 岩波新書

景観からよむ日本の歴史 (岩波新書) 作者:金田 章裕 岩波書店 Amazon 風景は、眺める人の心象が大事なものだが、景観は客観的なものだそうです。 この本は、日本各地の昔の地図や、著者が撮影した景観の写真を題材にして、どのような経緯で、地図のような、…

都道府県別の建築物リフォーム・リニューアル調査のデータ分析7 - リフォーム・リニューアルの金額を県民1人当たり所得で回帰分析してみる。

UnsplashのRedd Fが撮影した写真 www.crosshyou.info の続きです。 今回は、l_total: リフォーム・リニューアルの金額の対数変換値値をl_shotoku23: 平成23年基準の県民1人当たり所得の対数変換値で回帰分析してみます。1人当たり所得の所得が大きいほど、リ…

都道府県別の建築物リフォーム・リニューアル調査のデータ分析6 - Rのcaretパッケージでratioを予測するモデルを作る。その2

UnsplashのLeonid Antsiferovが撮影した写真 www.crosshyou.info の続きです。引き続き、caretパッケージでratioを予測するモデルを作成していきます。 まずは、linear regression modelで、もう少し複雑なモデルにしてみます。 l_totalの2乗項と、l_total x…

読書記録 - 「資本主義の方程式 経済停滞と格差拡大の謎を解く」 小野善康 著 中公新書

資本主義の方程式 経済停滞と格差拡大の謎を解く (中公新書) 作者:小野善康 中央公論新社 Amazon 日本の経済が停滞し、格差拡大しているのは何故か、ということを「資産選好」という観点から解説しています。 「資産選好」というのは、人々が(たとえ将来使う…

都道府県別の建築物リフォーム・リニューアル調査のデータ分析5 - Rのcaretパッケージでratioを予測するモデルを作る。その1

UnsplashのDiego PHが撮影した写真 www.crosshyou.info 前回は、l_totalを2016年度、2017年度、2018年度で回帰分析してみました。理論ベースでもbootstrapでのシミュレーションベースでも、年度によってl_totalの平均値には違いがあることが確認できました。…