crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

農林水産物の輸出上位20品目のデータ分析1 - R言語のread.csv関数でCSVファイルの読み込み。

今回は、農林水産品輸出上位20品目のデータを分析します。

政府統計の総合窓口(e-Stat) www.e-stat.go.jp のサイトからデータを取得しました。

f:id:cross_hyou:20201010114456p:plain

2020年10月9日に更新としてサイトのトップページにありましたので、これをクリックしました。

f:id:cross_hyou:20201010114554p:plain

データベースと、ファイルがあります。今回はデータベースをクリックしました。

f:id:cross_hyou:20201010114632p:plain

2018年の年次[56件]をクリックしました。

f:id:cross_hyou:20201010114714p:plain

DBをクリックしてファイルをダウンロードしました。APIを使えばRから直接取り込むことができるはずですが、やり方がわかりません。勉強しないとですね。

f:id:cross_hyou:20201010124841p:plain

ダウンロードしたファイルはこのようなものでした。28行目からデータがスタートしています。

R言語のread.csv関数でデータを読み込みます。

read.csv関数でCSVファイルを読み込む

str関数でdfを確認しましょう。

str関数でデータの構造を確認

データは読み込まれましたが、変数名が長いのがありますね。

それと、valueは数値データなのに文字列データになっています。

names関数で変数名を整えます。はじめの4つの変数名を変更します。

names関数

head関数で確認します。

head関数

valueを数値型にas.numeric関数で変換しましょう。

as.numeric関数

summary関数で確認します。

summary関数

valueが数値型に変換されました。

今回は以上です。