サンプルサイズの無視とは
サンプルサイズネグレクトは、Amos TverskyとDaniel Kahnemanによって有名に研究された認知バイアスです。 これは、統計情報のユーザーが問題のデータのサンプルサイズを考慮せずに誤った結論を下したときに発生します。
サンプルサイズネグレクトの根本的な原因は、小さなサンプルでは高いレベルの分散が発生する可能性が高いことを人々が理解できないことが多いことです。 したがって、特定の統計を作成するために使用されるサンプルサイズが、有意義な結論を出すのに十分な大きさであるかどうかを判断することが重要です。
サンプルサイズが十分に大きいかどうかを知ることは、統計的手法を十分に理解していない人にとっては困難な場合があります。
重要なポイント
- サンプルサイズネグレクトは、Amos TverskyとDaniel Kahnemanによって研究された認知バイアスであり、サンプルサイズの影響を考慮していないため、統計情報から誤った結論を引き出すことで構成されています。サンプルサイズはより不安定な統計結果に関連付けられ、逆もまた同様です。
サンプルサイズの無視について
サンプルサイズが小さすぎると、正確で信頼できる結論を引き出すことができません。 金融の文脈では、これは投資家をさまざまな方法で誤解させる可能性があります。
たとえば、投資家は、新しい投資ファンドの設立を見て、15%の年率収益を生み出したと自負するかもしれません。 投資家は、このファンドが急速な富の生成へのチケットであることをすぐに説明するかもしれません。 ただし、ファンドが非常に長い間投資していない場合、この結論は危険な方向に導かれる可能性があります。 その場合、結果は短期的な異常によるものであり、ファンドの実際の投資方法論とはほとんど関係がない可能性があります。
サンプルサイズネグレクトは、多くの場合、別の認知バイアスであるベースレートネグレクトと混同されます。 サンプルサイズネグレクトは、統計的クレームの信頼性を決定する際にサンプルサイズの役割を考慮しないことを指しますが、ベースレートネグレクトは、新しい情報を評価するときに現象に関する既存の知識を無視する傾向に関連します。
サンプルサイズの無視の実世界の例
Sample Size Neglectをよりよく理解するために、Amos TverskyとDaniel Kahnemanの研究から得た次の例を考えてください。
人は5つのボールのサンプルから絵を描くように求められ、4つが赤で、1つが緑であることがわかります。
人は20個のボールのサンプルから絵を描き、12個が赤で8個が緑であることを発見します。
どのサンプルがボールが主に赤であるというより良い証拠を提供しますか?
ほとんどの人は、赤と緑の比率が大きいサンプルよりもはるかに高いため、最初の小さいサンプルがより強力な証拠を提供すると言います。 ただし、実際には、サンプルサイズが小さいほど比率が高くなります。 20個のサンプルは、実際にはるかに強力な証拠を提供します。
Amos TverskyとDaniel Kahnemanの別の例は次のとおりです。
町には2つの病院があります。 大規模な病院では毎日平均45人の赤ちゃんが生まれ、小規模な病院では毎日約15人の赤ちゃんが生まれます。 すべての赤ちゃんの50%は男の子ですが、正確な割合は日ごとに変動します。
1年間、各病院は、赤ちゃんの60%以上が男の子であった日を記録しました。 そのような日を記録した病院はどれですか?
この質問に答えると、回答者の22%が、大規模な病院ではこのような日数が増えると答え、56%は両方の病院で結果が同じになると答えました。 実際、正解は、小規模な病院ほど大きな変動が生じるため、小規模な病院ではそのような日数をより多く記録することです。
前述したように、Sample Size Neglectの根源は、小さなサンプルでは高レベルの分散が発生する可能性が高いことを人々が理解できないことが多いことです。 投資において、これは確かに非常に費用がかかる可能性があります。