サンプル選択バイアスとは
サンプル選択バイアスは、統計分析のために非ランダムデータを選択することによって生じるバイアスの一種です。 バイアスは、特定の属性のためにデータのサブセットが体系的に除外されるサンプル選択プロセスの欠陥のために存在します。 サブセットを除外すると、テストの統計的有意性に影響したり、結果が歪んだりする可能性があります。
サンプル選択バイアスについて
生存バイアスは、サンプル選択バイアスの一般的なタイプです。 たとえば、大規模な株式グループで投資戦略をバックテストする場合、サンプル期間全体のデータを持つ証券を検索すると便利な場合があります。 15年分の株価データに対して戦略をテストする場合、15年の全期間にわたって完全な情報を持つ株式を探す傾向があります。 ただし、取引を停止した、または市場をすぐに離れた株式を削除すると、データサンプルにバイアスが入力されます。 15年の期間だけ在庫が含まれているため、市場で生き残るのに十分な性能を発揮したため、最終結果には欠陥があります。
ヘッジファンドのパフォーマンス指標は、サバイバーシップバイアスの影響を受けるサンプル選択バイアスの一例です。 生き残っていないヘッジファンドはインデックスアグリゲーターへのパフォーマンスのレポートを停止するため、結果のインデックスは残りのファンドと戦略に自然に傾いており、したがって「生き残ります」。これは人気のあるミューチュアルファンドレポートサービスでも問題になります。
アナリストはこれらの偏りを考慮して調整できますが、プロセスにニュースの偏りが生じる可能性があります。