動画⇩
https://youtu.be/1-WXx-CuTMM
機械学習モデルの予測結果が、どの説明変数によってどれほど影響を受けているのかを知ることは、モデルの理解を深め、実際の活用に役立ちます。
今回は、SHAP(Shapley Additive Explanations)を使用し、それぞれの変数が目的変数に与える影響度を分析しました。
SHAPとは?
SHAPはゲーム理論に基づいた手法で、各特徴量が予測結果にどの程度寄与しているかを定量化するものです。
機械学習モデルは通常「ブラックボックス」として扱われがちですが、SHAPを用いることで、どの変数が重要なのか、どのような影響を与えているのかを可視化できます。
SHAP値の計算と影響度の評価
今回、モデルの予測結果に対するSHAP値を取得し、影響度の高い順に並べて分析しました。
ただし、データフレームには未来の株価(売り時の価格など)が含まれていたため、そのままではデータリークが発生してしまいます。分析の際には、未来の値を取り除くことが必須です。
また、逆指値注文や差し値注文など、予測に直接関係のない変数も除外することで、より信頼性の高いSHAP値を算出できます。
適切に処理を施した後、影響度の高い変数を特定し、次回のシミュレーションや自動売買に活用することができます。
まとめ | SHAPの活用方法
SHAPを使うことで、どの変数がモデルの判断に大きく寄与しているのかが明確になり、次のステップとして有用な特徴量選択やシステム構築につなげられます。
次回の記事では、私が実際に売買システムで使用しているデータフレームの項目や、どのようにデータを構築しているのかについて詳しく解説します。ぜひお楽しみに!
ご覧いただきありがとうございました。また次回の記事でお会いしましょう。