サンプリング分布とは
サンプリング分布は、特定の母集団から抽出された多数のサンプルから取得された統計の確率分布です。 特定の母集団の標本分布は、母集団の統計に対して発生する可能性のあるさまざまな結果の範囲の頻度の分布です。
サンプリング分布について
学者、統計学者、研究者、マーケティング担当者、アナリストなどによって描かれ使用される多くのデータは、実際にはサンプルであり、人口ではありません。 サンプルは母集団のサブセットです。 たとえば、1995年から2005年までに北米で生まれたすべての赤ちゃんの平均体重を同じ期間内に南アメリカで生まれた赤ちゃんと比較したい医学研究者は、妥当な時間内に人口全体のデータを引き出すことはできません10年間で100万を超える出産が発生しました。 その代わりに、彼は結論を出すために、各大陸で、例えば100人の赤ちゃんの体重だけを使用します。 使用した200人の赤ちゃんの体重がサンプルであり、計算された平均体重がサンプルの平均です。
ここで、医学研究者が各大陸から100個の新生児体重のサンプルを1つだけ取得する代わりに、一般集団からランダムサンプルを繰り返し取得し、各サンプルグループのサンプル平均を計算するとします。 そのため、北米の場合、彼は次のように米国、カナダ、メキシコで記録された100新生児重量のデータを引き出します:米国の厳選された病院から4つの100サンプル、カナダから5つの70サンプル、メキシコからの3つの150レコード新生児の体重1200個のうち、12セットにグループ化されたもの。 また、南アメリカの12か国のそれぞれから出生時体重100のサンプルデータを収集しています。
各サンプルには独自のサンプル平均があり、サンプル平均の分布はサンプル分布として知られています。
各サンプルセットに対して計算された平均重みは、平均のサンプリング分布です。 サンプルから平均値を計算できるだけではありません。 標準偏差、分散、割合、範囲などの他の統計は、サンプルデータから計算できます。 標準偏差と分散は、サンプリング分布の変動性を測定します。
母集団の観測値の数、サンプルの観測値の数、およびサンプルセットの描画に使用される手順によって、サンプリング分布の変動性が決まります。 サンプリング分布の標準偏差は、標準誤差と呼ばれます。 サンプリング分布の平均は母集団の平均と同じですが、標準誤差は母集団の標準偏差、母集団のサイズ、および標本のサイズに依存します。
各サンプルセットの平均が互いに、また母集団の平均からどれだけ離れているかを知ることにより、標本の平均が母集団の平均にどれだけ近いかがわかります。 サンプルサイズが大きくなると、サンプリング分布の標準誤差は減少します。
特別な考慮事項
母集団または1つのサンプルの数値セットには、正規分布があります。 ただし、サンプリング分布には複数の観測セットが含まれるため、必ずしもベル型の形状になるとは限りません。
この例に従って、北米と南米の赤ちゃんの人口平均体重は、一部の赤ちゃんが低体重(平均以下)または過体重(平均以上)で、ほとんどの赤ちゃんが中間(平均付近)になるため、正規分布になります。 )。 北米の新生児の平均体重が7ポンドの場合、北米で記録された12組のサンプル観察結果のそれぞれのサンプルの平均体重も7ポンドに近くなります。
ただし、1, 200個のサンプルグループのそれぞれで計算された各平均をグラフ化すると、結果の形状は均一な分布になる可能性がありますが、実際の形状がどうなるかを確実に予測することは困難です。 研究者が100万を超える体重の母集団から使用するサンプルが多いほど、グラフは正規分布を形成し始めます。
- サンプリング分布は、特定の母集団から抽出された多数のサンプルから取得された統計の確率分布です。特定の母集団のサンプリング分布は、ある統計に対して発生する可能性のあるさまざまな結果の範囲の頻度の分布です。人口:学者、統計学者、研究者、マーケティング担当者、およびアナリストが引き出して使用するデータの多くは、実際には人口ではなくサンプルです。