サンプル定義

サンプルとは何ですか？

サンプルとは、大規模なグループの小規模で管理可能なバージョンを指します。これは、より大きな母集団の特性を含むサブセットです。母集団のサイズが大きすぎてすべての可能なメンバーまたは観測値をテストに含めることができない場合、サンプルは統計テストで使用されます。サンプルは、母集団全体を表し、特定の属性への偏りを反映してはなりません。

重要なポイント

サンプルとは、大規模なグループまたは大規模な集団のサブセットの小規模で管理可能なバージョンを指します。単純なランダムサンプリングでは、母集団内のすべてのエンティティが同一であるのに対し、層化されたランダムサンプリングでは母集団全体が小さなグループに分割されます。

サンプルについて

サンプルは、母集団から取得された公平な数の観測です。基本的に、母集団とは、特定の被験者の個人、動物、アイテム、観察、データなどの総数です。つまり、サンプルは、言い換えれば、グループ全体の一部、一部、または一部であり、母集団のサブセットとして機能します。サンプルは、研究が行われるさまざまな設定で使用されます。科学者、マーケティング担当者、政府機関、エコノミスト、および研究グループは、研究や測定にサンプルを使用する人々の中にいます。

調査全体に母集団全体を使用することには課題が伴うため、サンプルが使用されます。研究者は、全集団にすぐにアクセスするのに問題があるかもしれません。また、一部の研究の性質上、研究者は必要な結果をタイムリーに取得することが困難な場合があります。これが、研究を行う人々がサンプルを使用する理由です。人口全体を代表する少数の人々を使用しても、時間とリソースを削減しながら、有効な結果を生成できます。

研究者が使用するサンプルは、母集団に非常に似ている必要があります。サンプルのすべての参加者は、同じ特性と品質を共有する必要があります。したがって、研究が男性の大学の新入生に関するものである場合、サンプルはこの説明に適合する男性のわずかな割合である必要があります。同様に、研究グループが50歳以上の独身女性の睡眠パターンに関する研究を実施する場合、サンプルにはこの人口統計の女性のみを含める必要があります。

CFA試験のために40時間未満で勉強し、まだ合格した学生の数を知りたい学術研究者のチームを考えてみましょう。毎年200, 000人以上が世界中で試験を受験しているため、すべての試験参加者に手を差し伸べるのは非常に退屈で時間がかかる場合があります。実際、母集団からのデータが収集され分析されるまでに、数年が経過し、新しい母集団が出現したため、分析は無価値になりました。代わりに研究者ができることは、母集団のサンプルを取り、このサンプルからデータを取得することです。

偏りのないサンプルを取得するには、集団内の全員がグループに追加される可能性が等しくなるように、選択はランダムでなければなりません。

偏りのないサンプルを達成するには、選択はランダムである必要があるため、母集団の全員がサンプルグループに追加される可能性が等しくなりそうです。これは宝くじの抽選に似ており、単純なランダムサンプリングの基礎となります。

サンプリングの種類

単純なランダムサンプリング

母集団内のすべてのエンティティが同一である場合、単純なランダムサンプリングが理想的です。サンプルの被験者がすべて男性なのか女性なのか、何らかの形で両方の性別の組み合わせなのかを研究者が気にしない場合は、単純なランダムサンプリングが適切な選択手法である可能性があります。

2016年にCFA試験に受験した受験者が200, 000人いて、そのうち40％が女性、60％が男性だったとします。したがって、人口から抽出されたランダムなサンプルには、合計1, 000人の受験者に対して400人の女性と600人の男性がいるはずです。

しかし、40時間未満の学習後にテストに合格した男性と女性の比率を知ることが重要な場合はどうでしょうか？ここでは、単純なランダムサンプルよりも層別ランダムサンプルの方が適しています。

層別ランダムサンプリング

このタイプのサンプリングは、比例ランダムサンプリングまたはクォータランダムサンプリングとも呼ばれ、母集団全体をより小さなグループに分割します。これらは階層と呼ばれます。階層内の人々は同様の特性を共有しています。

もし年齢が研究者が彼らのデータに含めたい重要な要素だったらどうなるでしょうか？階層化されたランダムサンプリング手法を使用して、各年齢層のレイヤーまたは階層を作成できます。各階層からの選択は、ブラケット内の全員がサンプルに含まれる可能性が高いように、ランダムにする必要があります。たとえば、2人の参加者、AlexとDavidはそれぞれ22歳と24歳です。サンプルの選択では、何らかの優先メカニズムに基づいて一方を選択することはできません。どちらも、年齢グループから選択される可能性が等しくなければなりません。階層は次のようになります。

ストラタ（年齢）	人口の人数	サンプルに含まれる番号
20-24	30, 000	150
25-29	70, 000	350
30〜34	40, 000	200
35-39	30, 000	150
40〜44	20, 000	100
> 44	10, 000	50
合計	200, 000	1, 000

表から、人口は年齢層に分割されています。たとえば、20〜24歳の年齢範囲の30, 000人が2016年にCFA試験を受験しました。これと同じ割合を使用すると、サンプルグループには（30, 000÷200, 000）x 1, 000 = 150人の受験者が含まれます。サンプルの150人のランダムな試験参加者に、AlexまたはDavid、あるいはその両方、または両方が含まれる場合があります。

サンプルサイズを決定するときにコンパイルできる層はさらに多くあります。一部の研究者は、サンプルの作成方法を決定するときに、test = takersの職務、国、配偶者の有無などを入力する場合があります。

サンプルの例

2017年現在、世界の人口は75億人で、そのうち49.6％が女性、50.4％が男性です。特定の国の総人口は、人口規模でもあります。都市の学生の総数は人口とみなすことができ、都市の犬の総数も人口の大きさです。研究目的でこれらの集団からサンプルを採取できます。

CFA試験の例に続いて、研究者は、合計200, 000人の受験者（人口）から1, 000人のCFA参加者のサンプルを採取し、この数値で必要なデータを実行できます。このサンプルの平均は、40時間未満しか勉強しなかったにもかかわらず、合格したCFA試験の受験者の平均を推定するために使用されます。

採取したサンプルグループにバイアスをかけないでください。つまり、1, 000人のCFA試験参加者のサンプル平均が50である場合、200, 000人の受験者の母集団平均も約50である必要があります。

投資口座の比較×この表に表示されるオファーは、Investopediaが報酬を受け取るパートナーシップからのものです。プロバイダー名説明

階層化ランダムサンプリングの仕組み

マーケティングの必需品

単純ランダムサンプルと層別ランダムサンプル：違いは何ですか？

財務分析

階層化ランダムサンプリングの長所と短所

経済

代表サンプルとランダムサンプル：違いは何ですか？

経済

単純なランダムサンプル：長所と短所

経済

サンプルとは何ですか？

重要なポイント

サンプルについて

サンプリングの種類

単純なランダムサンプリング

層別ランダムサンプリング

サンプルの例

関連用語

関連記事

階層化ランダムサンプリングの仕組み

単純ランダムサンプルと層別ランダムサンプル：違いは何ですか？

階層化ランダムサンプリングの長所と短所

代表サンプルとランダムサンプル：違いは何ですか？

単純なランダムサンプル：長所と短所

単純なランダムサンプルを使用して、より大きな母集団を研究する利点は何ですか？

目次:

サンプルとは何ですか？

重要なポイント

サンプルについて

サンプリングの種類

単純なランダムサンプリング

層別ランダムサンプリング

サンプルの例

関連用語

関連記事

階層化ランダムサンプリングの仕組み

単純ランダムサンプルと層別ランダムサンプル：違いは何ですか？

階層化ランダムサンプリングの長所と短所

代表サンプルとランダムサンプル：違いは何ですか？

単純なランダムサンプル：長所と短所

単純なランダムサンプルを使用して、より大きな母集団を研究する利点は何ですか？

エディタの選択