2020-09-11

読書記録 - 「これならわかるコーポレートガバナンスの教科書」　松田千恵子著日経BP社

読書記録

これならわかるコーポレートガバナンスの教科書

作者:松田千恵子
発売日: 2015/08/11
メディア: Kindle版

コーポレートガバナンスとは、企業の舵取りを関係者間でいろいろと考えていこうよ、ということ。

そして、企業の舵取りというのは、普通は経営者に任せているので、この経営者という存在が的確な舵取りをしているのかを見定めたり、怠けていないか規律づけたりすることが関係者の役割になる。

2020-09-06

児童扶養手当受給者データの分析４ - R言語でカイ２乗検定。母子家庭比率及び父子家庭比率は地域によって違うのか？

データ分析

www.crosshyou.info

の続きです。

今回はR言語でカイ２乗検定をしてみます。

まずは、クロス表を作成します。

summarise関数

こうして作成したm_tblはtibbleオブジェクトです。このうち、1列目はいらないので、削除します。

rownames関数

m_tbl[ , -1]で1列目を削除して、as.matrix関数でマトリックス型オブジェクトに変換しました。そして、rownames関数で行名を設定しました。

これで終わりではないです。prefの値は、cityとlargeの受給者数も入っていますから、それを引かないといけないです。

マトリックスの計算

比率でも表示してみましょう。rowSums関数を使うと各行の合計が計算できます。

rowSums関数

prefのm_pop比率は88%と低いことがわかります。

それでは、chisq.test関数でカイ２乗検定をしてみます。

chisq.test関数

p-value < 2.2e-16と0.05よりも小さいですから、地域によって母子家庭世帯の受給者数は違いがある、ということですね。

chi_m_tbl$stdresとして調整済残差を見てみましょう。

$stdres 調整済残差

やはり、pref, この場合は政令指定都市と中核都市以外の地域、は母子家庭世帯の受給者数の比率が少ないことがわかります。

同じように父子家庭世帯についても調べましょう。

地域別の父子家庭世帯の受給者数

rowSums関数を利用して比率で表示しましょう。

地域別の父子家庭世帯の受給者数の比率

prefの比率が8.8%とcity, largeと比べて倍ちかくあります。

カイ２乗検定をしてみましょう。

chisq.test関数

p-value < 2.2e-16 ですから有意です。

調整済残差を見ます。

$stdres 調整済残差

やはり、prefで父子家庭世帯の受給者数の比率は高いです。

今回は以上です。

2020-09-05

児童扶養手当受給者データの分析３ - 地域のタイプ別に母子家庭比率、父子家庭比率を見てみる。

データ分析

www.crosshyou.info

の続きです。

前回の分析で、母子家庭比率、父子家庭比率は地域のタイプ(都道府県、指定都市、中核都市)によって違いがありそうだとわかりました。

グラフにして確かめてみます。

まずは、地域タイプ別の箱ひげ図を作成してみました。

ggplot関数+geom_boxplot関数

地域タイプ別の母子家庭比率

largeというのは政令指定都市です。cityは中核都市、prefは都道府県です。都道府県は母子家庭比率が低いように見えますね。

父子家庭比率も同じように見てます。

ggplot関数+geom_boxplot関数

地域タイプ別の父子家庭比率

父子家庭比率は都道府県が比率が高いようです。

group_by関数とsummarise関数をつかって集計してみます。

group_by関数とsummarise関数

母子家庭比率の平均値は政令指定都市(large)が92.6%で一番高く、

父子家庭比率の平均値は都道府県(pref)が6.12%と一番高いです。

でも、これは、各都道府県や政令指定都市、中核都市の比率の平均値ですから、正確な値ではありません。

正確な比率は、

都道府県の合計の母子家庭世帯の受給者数 / 都道府県の合計の総受給者数

で計算しないといけないです。

計算してみましょう。

group_by関数とsummarise関数

母子家庭比率は、政令指定都市(large)が92.8%で一番高く、

父子家庭比率は、都道府県(pref)が5.65%で一番高いです。

念のため検算してみましょう。

Rで算術計算

あっていますね。

今回は以上です。

2020-09-05

児童扶養手当受給者データの分析２ - 母子家庭と父子家庭の比率に注目。R言語のmutate関数、arrange関数, select関数などを使う。

データ分析

www.crosshyou.info

の続きです。

今回は、母子家庭の比率と父子家庭の比率に注目してみます。

母子家庭比率は、m_pop / t_pop で、

父子家庭比率は、f_pop / t_pop で計算できます。

mutate関数

母子家庭比率(m_ratio)のヒストグラムを見てみましょう。

ggplot関数+geom_histogram関数

母子家庭比率のヒストグラム

母子家庭比率はほとんどの地域で90%以上ですが、ひとつだけとても低い地域があります。どこでしょうか？arrange関数で小さい順に並び替えます。

arrange関数

select関数でtype, name, m_ratioだけを表示しています。そして、head関数ではじめ6行だけを表示しています。

高知市が一番、母子家庭比率が低いのですね。

母子家庭比率が高い地域はどこでしょうか？

arrange関数

郡山市が一番母子家庭比率の高い地域です。

父子家庭比率についてもヒストグラムを描いてみます。

ggplot関数+geom_histogram関数

父子家庭比率のヒストグラム

父子家庭比率はほとんどが10%以下ですね。

父子家庭比率の高い地域を見てみましょう。高知市、高知県かな？

arrange関数

あ、高知県はありましたが、高知市はありませんね。父子家庭比率が一番高いのは秋田県でした。

反対に父子家庭比率が低い地域はどこでしょうか？

arrange関数

郡山市、ありませんね。一番父子家庭比率が低い地域は岡崎市でした。富山市、川口市と続きます。

今回は以上です。

2020-09-05

児童扶養手当受給者データの分析１ - R言語にデータを読み込む。read.csv関数, str関数, function関数, mutate関数などを使用。

データ分析

今回は、児童扶養手当受給者データを分析しようと思います。

データは、政府統計の総合窓口、www.e-stat.go.jp から取得しました。

政府統計の総合窓口

9月4日の新着ファイルで、厚生労働省から福祉行政報告例というファイルがありましたのでこれをクリックします。

福祉行政報告例

クリックして進んでいきます。

福祉行政報告例

月次の統計です。クリックします。

福祉行政報告例

4月をクリックします。

福祉行政報告例

都道府県別統計表のほうをクリックします。

福祉行政報告例

統計表５が児童扶養手当受給者データです。

児童扶養手当受給者データ

このファイルを上のようなCSVファイルにしました。これをR言語のread.csv関数で読み込みます。

read.csv関数でCSVファイルを読み込む

上のCSVファイルは3行目からがデータなので、skip = 2　として2行を飛ばしています。

UTF-8のエンコードのファイルなので、encoding = "UTF-8"にしています。

str関数で確認してみます。

str関数

str関数でデータの型を見ると、m_sonota, m_iki, f_sonota, f_mikon, f_shogai, f_ikiのデータ型が文字列になっていますね。- があるからですね。- を0に変換して数値型に変えましょう。

function関数でカスタム関数の作成

function関数で - を 0 に変換する関数を作りました。

この関数を使います。

まず、tidyverseパッケージを読み込んでおきます。

tidyverseパッケージ

それでは - を0に変換してみます。

mutate関数

このように、mutate関数内でzero_henkan関数を使います。

もういちど、str関数で確認してみます。

str関数

データ型がnumとなっていて数値型にに代わっています。

最後にそれぞれの変数名の説明を書いておきます。

type:都道府県(pref)、政令指定都市(large)、中核都市(city)
name:都道府県、市の名前
t_pop:受給者数
m_pop:母子家庭の受給者総数
m_rikon:母子家庭の離婚世帯の受給者数
m_sonota:母子家庭のその他世帯受給者数
m_shibetsu:母子家庭の死別世帯の受給者数
m_shogai:母子家庭の障碍者世帯の受給者数
m_iki:母子家庭の遺棄世帯の受給者数
f_pop:父子家庭の受給者総数
f_rikon:父子家庭の離婚世帯の受給者数
f_sonota:父子家庭のその他世帯の受給者数
f_shibetsu:父子家庭の死別世帯の受給者数
f_shogai:父子家庭の障碍者世帯の受給者数
f_iki:父子家庭の遺棄世帯の受給者数
o_pop:母子家庭、父子家庭以外の世帯の受給者総数

今回は以上です。

2020-09-05

都道府県別の公害苦情件数データの分析９ - R言語のgather関数とspread関数を使う。

データ分析

www.crosshyou.info

の続きです。

分析７ではマニュアル作業でデータフレームの構成を作り替えましたが、あれから少し調べてみると、gather関数というので簡単にできるらしいです。やってみます。

gather関数

gather関数一つでできてしまううですね。

自分のためにgather関数の使い方をメモしておきます。

gather(key = X, value = Y, Z1, Z2, Z3,...)となっていて、key = X　と value = Y が新しく作られる変数名で、Z1, Z2, Z3,..がもともとある変数名で、この変数名がkey = X に格納されて、Z1, Z2, Z3,...の変数の値がvalue = Y に格納される、ということですね。

そして、この反対がspread関数です。

spread関数