分散分析(ANOVA)とは何ですか?
分散分析(ANOVA)は、統計で使用される分析ツールであり、データセット内にある観測された集計変動性を、系統的要因とランダム要因の2つの部分に分割します。 系統的要因は、与えられたデータセットに統計的な影響を及ぼしますが、ランダムな要因は影響しません。 アナリストは、ANOVAテストを使用して、回帰研究で独立変数が従属変数に与える影響を判断します。
20世紀に開発されたt検定法とz検定法は、ロナルドフィッシャーが分散分析法を作成した1918年まで統計分析に使用されました。 ANOVAはフィッシャーの分散分析とも呼ばれ、t検定とz検定の拡張です。 この用語は、フィッシャーの著書「研究労働者のための統計的方法」に登場した後、1925年に有名になりました。 実験心理学で採用され、後に、より複雑な科目に拡張されました。
ANOVAの式は次のとおりです。
。。。 F = MSEMSTここで:F = ANOVA係数MST =治療による平均平方和MSE =エラーによる平均平方和
分散分析は何を明らかにしますか?
ANOVAテストは、特定のデータセットに影響する要因を分析する最初のステップです。 テストが終了すると、アナリストは、データセットの不整合に測定可能なほど寄与する系統的要因に対して追加のテストを実行します。 アナリストは、f検定のANOVA検定結果を利用して、提案された回帰モデルと整合する追加データを生成します。
ANOVAテストでは、3つ以上のグループを同時に比較して、グループ間に関係が存在するかどうかを判断できます。 ANOVA式の結果であるF統計(F比とも呼ばれます)により、複数のグループのデータを分析して、サンプル間およびサンプル内の変動性を判断できます。
帰無仮説と呼ばれる、テストされたグループ間に実際の差が存在しない場合、ANOVAのF比統計量の結果は1に近くなります。サンプリングの変動は、フィッシャーF分布に従う可能性があります。 これは実際には、分子の自由度と分母の自由度と呼ばれる2つの特性値を持つ分布関数のグループです。
重要なポイント
- 分散分析(ANOVA)は、観測された分散データをさまざまなコンポーネントに分割して追加のテストに使用する統計的手法です。一元配置分散分析は、3つ以上のデータグループに使用され、依存関係と分散関係の情報を取得します独立変数:グループ間に真の分散が存在しない場合、ANOVAのF比は1に近くなります。
ANOVAの使用例
たとえば、研究者は複数の大学の学生をテストして、いずれかの大学の学生が他の大学の学生よりも常に優れているかどうかを確認できます。 ビジネスアプリケーションでは、R&Dの研究者は、製品を作成する2つの異なるプロセスをテストして、費用効率の面で1つのプロセスが他のプロセスよりも優れているかどうかを確認できます。
使用されるANOVAテストのタイプは、多くの要因に依存します。 データを実験的にする必要がある場合に適用されます。 分散分析は、ANOVAを手作業で計算する統計ソフトウェアへのアクセスがない場合に採用されます。 使い方は簡単で、小さなサンプルに最適です。 多くの実験計画では、サンプルサイズはさまざまな因子レベルの組み合わせで同じでなければなりません。
ANOVAは、3つ以上の変数のテストに役立ちます。 複数の2サンプルt検定に似ています。 ただし、タイプIエラーは少なくなり、さまざまな問題に適しています。 ANOVAは、各グループの平均を比較して差異をグループ化し、分散をさまざまなソースに分散することを含みます。 被験者、テストグループ、グループ間およびグループ内で使用されます。
一元配置分散分析対二元配置分散分析
ANOVAには、一方向(または単方向)と双方向の2種類があります。 一方向または双方向は、分散分析テストの独立変数の数を指します。 一元配置分散分析では、唯一の要因が唯一の応答変数に与える影響を評価します。 すべてのサンプルが同じかどうかを判断します。 一元配置分散分析を使用して、3つ以上の独立した(無関係な)グループの平均間に統計的に有意な差があるかどうかを判断します。
二元配置分散分析は、一元配置分散分析の拡張です。 一方向では、従属変数に影響を与える独立変数が1つあります。 双方向ANOVAでは、2つの独立者がいます。 たとえば、双方向ANOVAを使用すると、会社は給与やスキルセットなどの2つの独立した変数に基づいて労働者の生産性を比較できます。 2つの要因間の相互作用を観察し、2つの要因の効果を同時にテストするために使用されます。