分散インフレ率とは何ですか?
分散インフレーションfVarianceインフレーション係数(VIF)は、複数の回帰変数のセットにおける多重共線性の量の尺度です。 数学的には、回帰モデル変数のVIFは、単一の独立変数のみを含むモデルの分散に対するモデル全体の分散の比率に等しくなります。 この比率は、独立変数ごとに計算されます。 高VIFは、関連する独立変数がモデル内の他の変数と高度に共線であることを示します。
重要なポイント
- 分散インフレーション係数(VIF)は、重回帰モデルの独立変数間の多重共線性の尺度を提供します。多重共線性の検出は、モデルの説明力を低下させませんが、独立変数の統計的有意性を低下させるため重要です。 独立変数の大きなVIFは、モデルの構造および独立変数の選択において考慮または調整する必要がある他の変数との高度な共線関係を示します。
分散インフレ率を理解する
特定の結果に対する複数の変数の効果をテストしたい場合は、重回帰が使用されます。 従属変数は、モデルへの入力である独立変数の影響を受ける結果です。 多重共線性は、1つ以上の独立変数または入力間に線形関係または相関がある場合に存在します。 多重共線性は、入力がすべて互いに影響し合うため、実際には独立していないため、回帰モデル内で従属変数または結果にどの程度独立変数の組み合わせが影響するかをテストするのが難しいため、重回帰で問題を作成します。 統計的には、多重共線性が高い重回帰モデルでは、各独立変数と従属変数の間の関係を推定するのが難しくなります。 使用されるデータまたはモデル方程式の構造にわずかな変化があると、独立変数の推定係数に大きく不規則な変化が生じる可能性があります。
モデルが適切に指定され、正しく機能していることを確認するために、多重共線性について実行できるテストがあります。 分散膨張係数は、そのような測定ツールの1つです。 分散インフレーション係数を使用すると、多重共線性の問題の重大度を特定し、モデルを調整できます。 分散インフレーション係数は、独立変数の振る舞い(分散)が、他の独立変数との相互作用/相関によってどの程度影響または膨張するかを測定します。 分散インフレーション係数により、変数が回帰の標準誤差にどの程度寄与しているかを迅速に測定できます。 重大な多重共線性の問題が存在する場合、関連する変数の分散インフレーション係数は非常に大きくなります。 これらの変数を特定したら、複数のアプローチを使用して、共線性変数を削除または結合し、多重共線性の問題を解決できます。
多重共線性はモデルの全体的な予測力を低下させませんが、統計的に有意ではない回帰係数の推定値を生成できます。 ある意味では、それはモデル内の一種の二重カウントと考えることができます。 2つ以上の独立変数が密接に関連しているか、ほぼ同じことを測定している場合、それらが測定する根本的な効果は変数全体で2回(またはそれ以上)説明されており、どの変数が本当に独立変数。 多くの計量経済モデルの目標は、独立変数と従属変数の間のこの種の統計的関係を正確にテストすることであるため、これは問題です。
たとえば、経済学者が失業率(独立変数として)とインフレ率(従属変数として)の間に統計的に有意な関係があるかどうかをテストしたい場合。 失業率に関連する追加の独立変数を含めると、このような新しい最初の失業中の請求は、モデルに多重共線性を導入する可能性があります。 全体的なモデルは、強力で統計的に十分な説明力を示すかもしれませんが、その効果が失業率によるものなのか、新しい最初の失業保険によるものなのかを特定することはできません。 これはVIFが検出するものであり、研究者がテストに興味を持っている特定の仮説に応じて、モデルから変数の1つをドロップするか、それらを統合して共同効果をキャプチャする方法を見つけることを示唆しています。