【機械学習】私の前処理方法をご紹介

機械学習の第一歩!XGBoostを活用した前処理の工夫
動画⇩
https://lifeinfo-navi.com/machine-learning-preprocessing-xgboost/

こんにちは!今回は、初めての機械学習ということで、私が実践しているデータ前処理の方法をご紹介します。

機械学習の世界では、**「前処理を制する者は機械学習を制す」**と言われるほど、前処理は重要なプロセスです。

私自身、まだ初心者ですが、試行錯誤しながら学んでいる最中です。

1. 日付データの取り扱い
XGBoostを使って機械学習を行う際、日付データがあるとうまく学習が進まないことがあります。

そのため、データセットに含まれている日付型のカラムを除外しています。

これにより、学習プロセスのスムーズな進行を目指します。

2. 注文数量の正規化
次に、データの正規化について説明します。

たとえば、私が80万円を上限として株を購入する場合、以下のように計算します。

株価が7,000円や6,000円の場合 → 100株購入

株価が3,000円の場合 → 200株購入

このとき、「クワンティティ(注文数量)」が200であれば、100で割って「ノーマライズクワンティティ(Normalized Quantity)」を2とします。

3. スケール補正の工夫
機械学習での学習効率を高めるために、価格の変動の影響を均一化する工夫をしています。

例えば、10円の銘柄が1円上昇するのと、1,000円の銘柄が1円上昇するのとでは影響が全く異なります。

そこで、注文数量をかけることでスケールの調整を行い、より適切な学習を実現しています。

機械学習を活用した自動売買に役立てるため、引き続き勉強を進めていきます!

今後もこのブログでは、機械学習×株式投資に関する情報を発信していきますので、ぜひチェックしてみてください!

【機械学習】私の前処理方法をご紹介
ツイートもチェックしよう!