体系的なサンプリングとは
システマティックサンプリングは、ランダムな開始点に従って固定された周期的な間隔で、より大きな母集団からサンプルメンバーが選択される確率サンプリング法の一種です。 サンプリング間隔と呼ばれるこの間隔は、母集団サイズを目的のサンプルサイズで除算して計算されます。
サンプル母集団は事前に選択されていますが、周期的な間隔が事前に決定され、開始点がランダムである場合、体系的なサンプリングは依然としてランダムであると考えられます。
統計的推論のために母集団をサンプリングする方法はいくつかあります。 体系的なサンプリングは、ランダムサンプリングの1つの形式です。
体系的なサンプリング
体系的なサンプリングの仕組み
母集団の単純なランダムサンプリングは非効率的で時間がかかるため、統計学者は体系的なサンプリングなどの他の方法に頼ります。 体系的なアプローチによるサンプルサイズの選択は、迅速に行うことができます。 固定の開始点が特定されると、参加者の選択を容易にするために一定の間隔が選択されます。
データ操作のリスクが低い場合は、単純なランダムサンプリングよりも体系的なサンプリングの方が適しています。 研究者が間隔の長さを操作して目的の結果を得ることができる場合にこのようなリスクが高い場合は、単純なランダムサンプリング手法がより適切です。
体系的なサンプリングは、そのシンプルさから研究者やアナリストに人気があります。 研究者は通常、ランダムな特性が「 n 番目」のデータサンプルごとに不均衡に存在しない限り(ほとんどありません)、結果はほとんどの正常な母集団の代表であると仮定します。 言い換えると、母集団は、選択されたメトリックに沿って自然度のランダム性を示す必要があります。 人口が標準化されたパターンのタイプを持っている場合、非常に一般的なケースを誤って選択するリスクがより明白になります。
体系的なサンプリングでは、他のサンプリング方法と同様に、参加者を選択する前にターゲット母集団を選択する必要があります。 実施されている研究の目的に合った任意の数の望ましい特性に基づいて、母集団を特定できます。 一部の選択基準には、年齢、性別、人種、場所、教育レベル、職業などがあります。
- システマティックサンプリングは、一定の周期的な間隔(サンプリング間隔)でランダムな開始点に従って、より大きな母集団からサンプルメンバーが選択される確率サンプリング手法の一種です。この方法論のその他の利点には、クラスター化された選択の現象を排除し、データを汚染する可能性が低いことです。欠点には、特定のパターンの過剰または過少表示とデータ操作のリスクが含まれます。
体系的なサンプリングの例
体系的なサンプリングの仮想的な例として、人口10, 000人で、統計学者が100人ごとにサンプリングを選択すると仮定します。 サンプリング間隔は、12時間ごとに新しいサンプルを選択するなど、体系的にすることもできます。
別の例として、系統的サンプリングを使用して人口50, 000人からランダムに1, 000人のグループを選択する場合、すべての潜在的な参加者をリストに入れて開始点を選択する必要があります。 リストが作成されると、50, 000 / 1, 000 = 50であるため、リストの50人ごと(選択した開始ポイントでカウントを開始)が参加者として選択されます。
たとえば、選択した開始点が20の場合、リストの70番目の人が選択され、その後に120番目の人が続きます。 リストの最後に到達し、追加の参加者が必要な場合、カウントはリストの先頭にループしてカウントを終了します。
体系的なサンプリングとクラスターサンプリング
系統的サンプリングとクラスターサンプリングは、サンプルに含まれる母集団からサンプルポイントを取得する方法が異なります。 クラスターサンプリングは母集団をクラスターに分割しますが、体系的なサンプリングは、より大きな母集団からの固定間隔を使用してサンプルを作成します。
系統的サンプリングは母集団からランダムな開始点を選択し、その後、そのサイズに応じて母集団の定期的な固定間隔からサンプルが取得されます。 クラスターサンプリングは、母集団をクラスターに分割し、各クラスターから単純なランダムサンプルを取得します。
クラスタサンプリングは、他のサンプリング方法よりも精度が低いと見なされます。 ただし、サンプルを取得するコストを節約できます。 クラスタサンプリングは、2ステップのサンプリング手順です。 人口全体のリストを完成させるのが難しい場合に使用できます。 たとえば、食料品店の顧客の全人口をインタビューするように構築することは困難です。
ただし、人は店舗のランダムなサブセットを作成できます。これはプロセスの最初のステップです。 2番目のステップは、これらの店舗の顧客のランダムサンプルにインタビューすることです。 これは、時間とお金を節約できる簡単な手動プロセスです。
体系的なサンプリングの制限
体系的なサンプリングを行う際に統計学者が考慮しなければならないリスクの1つは、サンプリング間隔で使用されるリストの構成方法に関係します。 リストに配置された母集団が、サンプリング間隔に一致する周期的なパターンで編成されている場合、選択されたサンプルは偏っている可能性があります。
たとえば、会社の人事部門は、従業員のサンプルを選択し、会社のポリシーについてどのように感じているかを尋ねます。 従業員は20人のチームにグループ化され、各チームはマネージャーが率います。 サンプルサイズを選択するために使用されるリストが、チームが一緒にクラスター化されて編成されている場合、統計学者は、サンプリング間隔に応じてマネージャーのみ(またはマネージャーなし)を選択するリスクがあります。