【XGBoost初心者向け】とりあえず使ってみた!モデル作成の第一歩

動画⇩
https://youtu.be/nIoid19-uKM

機械学習に興味があっても、「どこから手をつければいいのか分からない…」という方は多いのではないでしょうか?

私もその一人。そこで、まずはKaggleでもよく使われる XGBoost に触れてみることにしました!

今回は とりあえず動かすことを目的に、XGBoostを使ってモデルを作成しました。

自分なりに試行錯誤しながら進めたので、その過程を共有していきます。

1. XGBoostのデータ準備

まず、機械学習では 特徴量(Xラベル)と目的変数(Yラベル) を適切に分ける必要があります。

私の場合、ベネフィット というカラムは不要だったので、Xラベルから削除。逆に、Yラベルには ベネフィット だけを設定しました。

次に、学習データとテストデータを 8:2の割合 に分割。

学習用(80%)でモデルを訓練し、テスト用(20%)で評価する形です。

また、XGBoostで使えないデータ型(日付データなど)は 前処理で除外 しています。

2. XGBoostのパラメータ設定

XGBoostでは、モデルの性能を左右する パラメータ調整 が重要です。

具体的には、以下のような設定があります。
決定木の深さ(max_depth)
学習率(learning_rate)
使用するデータの割合(subsample)
ただ、正直まだよく分かっていません(笑)

とりあえずデフォルト設定のまま動かし、後で調整していこうと思います。

3. モデル学習
いよいよ XGBoostでモデルを学習 します!

学習後、model1 というモデルが完成しました。

まだ評価までは行っていませんが、まずは動かすことが大事!

使ってみることで理解が深まり、学習意欲も上がってきました。

4. 今後の展望
次回の動画では、今回作成したモデルの 精度検証 を行っていきます。

XGBoostがどの程度の性能を発揮するのか、評価指標を使って確認 していく予定です!

これからも実践を通して学んでいきますので、ぜひ一緒に機械学習を楽しんでいきましょう!
ご覧いただき、ありがとうございました。

次回もお楽しみに!

【XGBoost初心者向け】とりあえず使ってみた!モデル作成の第一歩
ツイートもチェックしよう!