ノンパラメトリック統計とは何ですか?
ノンパラメトリック統計とは、正規分布に適合するためにデータを必要としない統計的手法を指します。 ノンパラメトリック統計では、多くの場合順序的なデータが使用されます。つまり、数値ではなく、ランク付けや並べ替え順序に依存します。 たとえば、好きなものから嫌いなものまでの消費者の好みを伝える調査は、順序データと見なされます。
ノンパラメトリック統計には、ノンパラメトリック記述統計、統計モデル、推論、および統計検定が含まれます。 ノンパラメトリックモデルのモデル構造は アプリオリに 指定さ れるので はなく、データから決定されます。 ノンパラメトリック という用語は、そのようなモデルにパラメーターが完全に欠けていることを意味するものではなく、パラメーターの数と性質が柔軟であり、事前に固定されていないことを意味します。 ヒストグラムは、確率分布のノンパラメトリック推定の一例です。
ノンパラメトリック統計について
統計では、パラメトリック統計には平均、中央値、標準偏差、分散などのパラメーターが含まれます。この形式の統計では、観測データを使用して分布のパラメーターを推定します。 パラメトリック統計では、データは未知のパラメーターμ(母集団の平均)とσ2(母集団の分散)の正規分布に適合すると仮定され、これらは標本平均と標本分散を使用して推定されます。
ノンパラメトリック統計では、サンプルサイズや、観測されたデータが定量的であるかどうかについては想定されていません。
ノンパラメトリック統計は、データが正規分布から引き出されることを想定していません。 代わりに、分布の形状は、この形式の統計測定で推定されます。 正規分布が想定される状況は数多くありますが、データが正常に分布するかどうかを判断できないシナリオもあります。
ノンパラメトリック統計の例
最初の例では、茶色の目で生まれた北米の赤ちゃんの数の推定値が必要な研究者が、150, 000人の赤ちゃんのサンプルを取り、データセットの分析を実行することを決定する場合があります。 彼らが導き出した測定値は、翌年生まれの茶色の目を持つ赤ちゃんの全人口の推定値として使用されます。
2番目の例として、早寝か遅寝かが病気になる頻度に関係しているかどうかを知りたい別の研究者を考えてみましょう。 サンプルが母集団からランダムに選択されると仮定すると、病気の頻度のサンプルサイズ分布は正常であると想定できます。 ただし、細菌の菌株に対する人体の耐性を測定する実験は、正規分布を持つとは想定できません。
これは、ランダムに選択されたサンプルデータがひずみに抵抗する可能性があるためです。 一方、研究者が遺伝的構成や民族性などの要因を考慮する場合、これらの特性を使用して選択されたサンプルサイズはその株に耐性がない可能性があることがわかります。 したがって、正規分布を仮定することはできません。
この方法は、データに明確な数値解釈がない場合に役立ち、並べ替えのランキングがあるデータで使用するのが最適です。 たとえば、性格評価テストでは、メトリックのランキングを、強く反対、反対、無関心、同意、および強く同意として設定することができます。 この場合、ノンパラメトリック手法を使用する必要があります。
特別な考慮事項
ノンパラメトリック統計は、その使いやすさにより高く評価されています。 パラメータの必要性が緩和されると、データはより多くの種類のテストに適用できるようになります。 このタイプの統計は、平均、サンプルサイズ、標準偏差、またはその情報が利用できない場合に他の関連パラメーターの推定なしで使用できます。
ノンパラメトリック統計では、サンプルデータに関する仮定が少ないため、その適用範囲はパラメトリック統計よりも広くなっています。 パラメトリックテストがより適切な場合、ノンパラメトリックメソッドの効率は低下します。 これは、ノンパラメトリック統計から得られた結果の信頼度が、パラメトリック統計を使用して得られた場合よりも低いためです。
重要なポイント
- ノンパラメトリック統計は簡単に使用できますが、他の統計モデルの正確な精度を提供するものではありません。このタイプの分析は、何かの順序を考慮する場合に最適です。