(Bing Image Creator で生成: プロンプト: Closeup of pink Jasminum flowers and white Jasminum flowers, background is African desert land, white clouds, photo)
今回からしばらくは、UCI Machine Learning Repository の Bank Marketing のデータセットを使って、Classification をやってみたいと思います。
Moro, S., Rita, P., & Cortez, P. (2014). Bank Marketing [Dataset]. UCI Machine Learning Repository. https://doi.org/10.24432/C5K306.
ダウンロードしたデータセットはこんな感じです。
これを R で分析します。まず、tidyverse パッケージの読み込みをします。
read_csv() 関数でCSVファイルにあるデータセットをインポートします。
glimpse() 関数でデータフレームのはじめの数行の値を確認します。
45211個の観測データ、17の変数があることがわかります。
summary() 関数を使って、データフレームのサマリーをみてみます。
NAの観測データがあるか確認してみます。
NAの観測データは無いようです。
今回は以上です。
次回は
です。
今回のコードは以下になります。
#
#### start of 1 ####
#
# tidyverse パッケージの読み込み
library(tidyverse)
#
# CSVファイルをインポート
df_raw <- read_csv("bank_marketing.csv")
#
# データフレームのはじめの数行
glimpse(df_raw)
#
# データフレームのサマリー
summary(df_raw)
#
# NA があるかどうか
colSums(is.na(df_raw))
#
#### end of 1 ####
#