Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

UCI Machine Learning Repository の Bank Marketing のデータの分析1 - R にデータをインポート

(Bing Image Creator で生成: プロンプト: Closeup of pink Jasminum flowers and white Jasminum flowers, background is African desert land, white clouds, photo)

今回からしばらくは、UCI Machine Learning Repository の Bank Marketing のデータセットを使って、Classification をやってみたいと思います。

Moro, S., Rita, P., & Cortez, P. (2014). Bank Marketing [Dataset]. UCI Machine Learning Repository. https://doi.org/10.24432/C5K306.

ダウンロードしたデータセットはこんな感じです。

これを R で分析します。まず、tidyverse パッケージの読み込みをします。

read_csv() 関数でCSVファイルにあるデータセットをインポートします。

glimpse() 関数でデータフレームのはじめの数行の値を確認します。

45211個の観測データ、17の変数があることがわかります。
summary() 関数を使って、データフレームのサマリーをみてみます。

NAの観測データがあるか確認してみます。

NAの観測データは無いようです。

今回は以上です。

次回は

www.crosshyou.info

です。

 

今回のコードは以下になります。

#
#### start of 1 ####
#
# tidyverse パッケージの読み込み
library(tidyverse)
#
# CSVファイルをインポート
df_raw <- read_csv("bank_marketing.csv")
#
# データフレームのはじめの数行
glimpse(df_raw)
#
# データフレームのサマリー
summary(df_raw)
#
# NA があるかどうか
colSums(is.na(df_raw))
#
#### end of 1 ####
#