適合度とは何ですか?
適合度検定は、標本データが正規分布の母集団からの分布にどの程度適合するかを確認する統計的仮説検定です。 別の言い方をすれば、このテストは、サンプルデータが実際の母集団で見つかると予想されるデータを表しているのか、それとも何らかの偏りがあるのかを示します。 適合度は、観測値と正規分布の場合にモデルに期待される値との不一致を確立します。
適合度を決定する方法は複数あります。 統計で使用される最も一般的な方法には、カイ2乗、コルモゴロフ-スミルノフ検定、アンダーソン-ダーリング検定、およびシピロ-ウィルク検定があります。
重要なポイント
- 適合度検定は、観測値のセットが適用モデルで予想される値と一致するかどうかを判断することを目的とした統計的検定です。適合度検定には複数のタイプがありますが、最も一般的なのはカイ二乗検定です。テストでは、サンプルデータが正規分布の母集団からの予想されるデータセットに適合するかどうかを示すことができます。
適合度の理解
適合度テストは、多くの場合、ビジネスの意思決定に使用されます。 カイ二乗適合度を計算するには、最初に帰無仮説と対立仮説を述べ、有意水準(α= 0.5など)を選択して、臨界値を決定する必要があります。
最も一般的な適合度検定は、一般に離散分布に使用されるカイ二乗検定です。 カイ二乗検定は、クラス(ビン)に入れられたデータ専用に使用され、正確な結果を生成するために十分なサンプルサイズが必要です。
適合度テストは、通常、残差の正規性をテストするため、または2つのサンプルが同一の分布から収集されているかどうかを判断するために使用されます。
適合度テストの例
たとえば、小さなコミュニティジムは、月曜日、火曜日、土曜日に最も出席率が高く、水曜日と木曜日に平均出席率があり、金曜日と日曜日に最も出席率が低いという前提で運営されている場合があります。 これらの仮定に基づいて、ジムは毎日一定数のスタッフを雇用し、メンバーのチェックイン、施設の清掃、トレーニングサービスの提供、クラスの指導を行っています。
しかし、ジムは経済的にうまく機能しておらず、所有者はこれらの出席の仮定と人員配置レベルが正しいかどうかを知りたいと思っています。 所有者は、6週間毎日ジムの参加者数を数えることにしました。 次に、ジムの想定出席率を、たとえばカイ二乗適合度テストを使用して、観察された出席率と比較できます。 新しいデータを使用して、ジムの最適な管理方法と収益性の改善方法を決定できます。