オーバーフィットとは何ですか?
オーバーフィッティングは、関数が限られたデータポイントのセットに非常に近似している場合に発生するモデリングエラーです。 モデルの過剰適合は、一般に、研究中のデータの特異性を説明するために過度に複雑なモデルを作成するという形を取ります。
実際には、よく研究されるデータにはある程度の誤差またはランダムなノイズが含まれています。 したがって、モデルをあまりに厳密に適合させてわずかに不正確なデータにしようとすると、モデルに重大なエラーが発生し、予測力が低下する可能性があります。
重要なポイント
- オーバーフィッティングは、関数が限られたデータポイントセットにあまりにも密接に適合している場合に発生するモデリングエラーです。
オーバーフィットを理解する
たとえば、一般的な問題は、コンピューターアルゴリズムを使用して、パターンを見つけるために、過去の市場データの広範なデータベースを検索することです。 十分な研究が行われていると、株式市場のリターンなどを正確に予測する精巧な定理を開発することがしばしば可能です。
ただし、サンプル外のデータに適用した場合、そのような定理は、実際には単なる偶然の発生に対するモデルの単なる過剰適合であることが判明する可能性があります。 すべての場合において、モデルの開発に使用したサンプルの範囲外のデータに対してモデルをテストすることが重要です。
金融の専門家は、限られたデータに基づいてモデルを過剰適合させる危険性を常に認識している必要があります。