動画⇩
https://youtu.be/nIoid19-uKM
機械学習に興味があっても、「どこから手をつければいいのか分からない…」という方は多いのではないでしょうか?
私もその一人。そこで、まずはKaggleでもよく使われる XGBoost に触れてみることにしました!
今回は とりあえず動かすことを目的に、XGBoostを使ってモデルを作成しました。
自分なりに試行錯誤しながら進めたので、その過程を共有していきます。
1. XGBoostのデータ準備
まず、機械学習では 特徴量(Xラベル)と目的変数(Yラベル) を適切に分ける必要があります。
私の場合、ベネフィット
というカラムは不要だったので、Xラベルから削除。逆に、Yラベルには ベネフィット
だけを設定しました。
次に、学習データとテストデータを 8:2の割合 に分割。
学習用(80%)でモデルを訓練し、テスト用(20%)で評価する形です。
また、XGBoostで使えないデータ型(日付データなど)は 前処理で除外 しています。
2. XGBoostのパラメータ設定
XGBoostでは、モデルの性能を左右する パラメータ調整 が重要です。
具体的には、以下のような設定があります。
決定木の深さ(max_depth)
学習率(learning_rate)
使用するデータの割合(subsample)
ただ、正直まだよく分かっていません(笑)
とりあえずデフォルト設定のまま動かし、後で調整していこうと思います。
3. モデル学習
いよいよ XGBoostでモデルを学習 します!
学習後、model1
というモデルが完成しました。
まだ評価までは行っていませんが、まずは動かすことが大事!
使ってみることで理解が深まり、学習意欲も上がってきました。
4. 今後の展望
次回の動画では、今回作成したモデルの 精度検証 を行っていきます。
XGBoostがどの程度の性能を発揮するのか、評価指標を使って確認 していく予定です!
これからも実践を通して学んでいきますので、ぜひ一緒に機械学習を楽しんでいきましょう!
ご覧いただき、ありがとうございました。
次回もお楽しみに!
【XGBoost初心者向け】とりあえず使ってみた!モデル作成の第一歩
- 2025-03-16
- 2025-03-17
- システムトレード
- 8view

ツイートもチェックしよう!