の続きです。
前回は東京都のブロードバンドサービス契約数がとても大きな伸び率だとわかりました。今回は47都道府県の2010年度から2017年度のtv: テレビ放送受信契約数、catv: ケーブルテレビ加入世帯数、bb: ブロードバンドサービス契約数の伸びを見てみましょう。
まず、2010年度だけ、2017年度だけのデータフレームをR言語のfilter関数で作ります。
次にrename関数でtv, catv, bbという変数名に_2010, _2017を加えます。
yearという変数はもういらないので、select関数で削除します。
inner_join関数でdf_2010とdf_2017を合体させます。
二つのデータフレームに共通している、pref: 都道府県名の変数で合体しました。
mutate関数でtv, catv, bbの伸び率(倍率)を計算します。
summary関数でdf2をみてみましょう。
tv_grがテレビ放送受信契約数の伸びですが、最小値でも1.024ですから、全ての都道府県で増加したことがわかります。
catv_grがケーブルテレビ加入世帯数の伸びです。最小値は0.3908と6割も減った都道府県がある一方、最大値が1.2160と2割も増加した都道府県があることがわかります。
bb_grがブロードバンドサービス契約数の伸びです。最小値は4.896で最大値が9.135です。一番伸びが小さいところでも5倍近い伸びですね。
tv_grのヒストグラムを描いてみます。
catv_grのヒストグラムを描きます。
bb_grのヒストグラムを描きます。
catv_grは左側の裾野が広い分布で、tv_grとbb_grは右側の裾野が広い分布ですね。
今回は以上です。
次回は、
です。
はじめから読むには、
です。