カイ二乗統計とは
カイ二乗( χ2 ) 統計は、期待値が実際の観測データ(またはモデル結果)と比較される方法を測定するテストです。 カイ2乗統計量の計算に使用されるデータは、ランダム、生、相互に排他的、独立変数から抽出され、十分に大きいサンプルから抽出される必要があります。 たとえば、コインを100回投げた結果は、これらの基準を満たしています。
カイ二乗検定は、仮説検定でよく使用されます。
カイ二乗の式は
χc2= ∑(Oi−Ei)2Eiwhere:c =自由度O =観測値E =期待値\ begin {aligned}&\ chi ^ 2_c = \ sum \ frac {(O_i-E_i)^ 2} {E_i} \&\ textbf {where:} \&c = \ text {自由度} \&O = \ text {観測値} \&E = \ text {期待値} \ \ end {aligned}χc2= ∑Ei(Oi -Ei)2ここで:c =自由度O =観測値E =期待値
カイ二乗統計から何がわかりますか?
カイ二乗検定には主に2つの種類があります。独立性の検定は、「性別とSATスコアの間に関係はありますか?」などの関係の質問をします。 「適合度テスト」では、「コインを100回投げると、頭が50回、尻尾が50回出ますか?」
これらのテストでは、実験内の変数とサンプルの総数に基づいて、特定の帰無仮説を拒否できるかどうかを判断するために自由度が利用されます。
たとえば、学生とコースの選択を検討する場合、30人または40人の学生のサンプルサイズは、重要なデータを生成するのに十分な大きさではない可能性があります。 400人または500人の学生のサンプルサイズを使用した調査から同じまたは類似の結果を取得する方がより有効です。
別の例では、コインを100回投げることを検討してください。 公正なコインを100回投げると、頭が50回、尻尾が50回現れるという予想される結果です。 実際の結果は、頭が45回現れ、尾が55回現れるということです。 カイ二乗統計は、期待される結果と実際の結果との矛盾を示します。
カイ二乗検定の例
男性と女性の両方の2, 000人の有権者を対象にランダムな投票が行われたと想像してください。 回答した人々は、性別と、共和党員、民主党員、または独立者であるかによって分類されました。 共和党、民主党、独立のラベルが付いた列と、男性と女性のラベルが付いた2行のグリッドを想像してください。 2, 000人の回答者のデータは次のとおりであると仮定します。
カイ2乗統計を計算する最初のステップは、予想される頻度を見つけることです。 これらは、グリッド内の「セル」ごとに計算されます。 性別には2つのカテゴリーがあり、政治的見解には3つのカテゴリーがあるため、合計6つの予想頻度があります。 予想される頻度の式は次のとおりです。
E(r、c)= n(r)×c(r)nwhere:r =質問の行c =質問の列=対応する合計\ begin {aligned}&E(r、c)= \ frac {n(r)\回c(r)} {n} \&\ textbf {where:} \&r = \ text {問題の行} \&c = \ text {問題の列} \&n = \ text {対応する合計} \ \ end {aligned} E(r、c)= nn(r)×c(r)where:r = questionの行c = questionnの列=対応する合計
この例では、予想される頻度は次のとおりです。
- E(1, 1)=(900 x 800)/ 2, 000 = 360E(1, 2)=(900 x 800)/ 2, 000 = 360E(1, 3)=(200 x 800)/ 2, 000 = 80E(2, 1 )=(900 x 1, 200)/ 2, 000 = 540E(2, 2)=(900 x 1, 200)/ 2, 000 = 540E(2, 3)=(200 x 1, 200)/ 2, 000 = 120
次に、これらの値を使用して、次の式を使用してカイ2乗統計量を計算します。
Chi-squared = ∑2E(r、c)where:O(r、c)=指定された行と列の観測データ\ begin {aligned}&\ text {Chi-squared} = \ sum \ frac {^ 2} {E(r、c)} \&\ textbf {where:} \&O(r、c)= \ text {指定された行と列の観測データ} \ \ end {aligned} Chi-squared = ∑E(r、c)2ここで:O(r、c)=特定の行と列の観測データ
この例では、各観測値の式は次のとおりです。
- O(1, 1)=(400-360)2/360 = 4.44O(1, 2)=(300-360)2/360 = 10O(1, 3)=(100-80)2/80 = 5O (2, 1)=(500-540)2/540 = 2.96O(2, 2)=(600-540)2/540 = 6.67O(2, 3)=(100-120)2/120 = 3.33
カイ2乗統計は、これらの値の合計、つまり32.41に等しくなります。 結果が統計的に有意であるかどうかを確認するために、セットアップの自由度が与えられているかどうかを確認するために、カイ二乗統計表を見ることができます。