今回は、通信・放送産業動態調査というデータを使って分析をしたいと思います。
通信・放送産業動態調査とは、e-Statのウェブサイトを見ると、
通信・放送産業動態調査は、通信・放送産業の経営動向に関する動態を調査することで、産業活動の活況度、変化の動向、将来動向を把握して支援施策等各種施策の機動的な企画推進に資することにより、通信・放送産業の振興・健全な発展に寄与することを目的としています。
調査では、情報通信業を営む約160社を抽出し、事業者の当該業務の月間売上高と、当該期と比較した来期・再来期の売上高・資金繰り・自社景況予測の判断を調査しています。
調査の結果は四半期ごとに公表し、業種別の各月売上高や業況の見通し等を提供しています。
とのことです。
ここからダウンロードしたExcelファイルはこんなものでした。
各月売上高の対前年同月比のデータです。
まず、全体の通信・放送産業全体があって、それが電気通信業、放送事業の2つに分解され、さらに放送事業が民間放送事業とケーブルテレビ事業に分かれている、という構造のようです。
つまり末端レベルは電気通信業、民間放送事業、ケーブルテレビ事業という3つです。
このExcelデータを少し加工して、このようなcsvファイルにしました。
いままでの分析では、年は2006年、月は4月と「年」「月」の文字を入れていましたが、今回は数字だけにしました。それとTOPIX(東証株価指数)の前年同月比も加えてみました。TOPIXのデータは、景気動向指数の先行系列のデータからとってきました。
このcsvファイルをR言語で読み込んで分析をしたいと思います。read.csv関数を使ってsummary関数でサマリーデータを表示します。
こうしてみると、ケーブルテレビの平均値が5.533と他の業態よりも高く伸びている業態だとわかります。たしかに私の住んでいるマンションでもJCOMのテレビが視聴できるように2,3年前になりました。summary関数では標準偏差が計算されないので、標準偏差を計算するsd関数をすべての列でいっぺんに関数を適用するapply関数を利用してすべての変数の標準偏差を計算します。
TOPIXの標準偏差が一番大きく、変動の度合いが大きいことがわかります。
length関数でデータの数を確認しておきましょう。
データの数は144個でした。