決定係数は何ですか?
決定係数は、モデルが将来の結果をどの程度説明し、予測するかを評価する統計分析で使用される尺度です。 データセットの説明された変動性のレベルを示しています。 一般に「R 2乗」とも呼ばれる決定係数は、モデルの精度を測定するためのガイドラインとして使用されます。
この図を解釈する1つの方法は、特定のモデルに含まれる変数が、観測された変動の約x%を説明すると言うことです。 したがって、R 2 = 0.50の場合、観測された変動の約半分をモデルで説明できます。
R二乗
重要なポイント
- 決定係数は、将来のデータモデルの統計分析を中心とした複雑なアイデアであり、決定係数は、ある因子の変動が別の因子との関係によってどれほどの変動を引き起こす可能性があるかを説明するために使用されます。
決定係数を理解する
決定係数は、ある因子の別の因子との関係によってどれだけの変動が引き起こされるかを説明するために使用されます。 トレンド分析に大きく依存しており、0〜1の値として表されます。
値が1に近いほど、2つの因子間の適合度または関係が良好になります。 決定係数は相関係数の2乗で、「R」とも呼ばれ、2つの変数間の線形相関の程度を表示できます。
この相関は「適合度」として知られています。 値1.0は完全な適合を示します。したがって、これは将来の予測に対して非常に信頼性の高いモデルであり、モデルが観測された すべて の変動を説明することを示します。 一方、値0は、モデルがデータを正確にモデル化できないことを示します。 重回帰モデルなど、複数の変数を持つモデルの場合、調整されたR 2がより良い決定係数です。 経済学では、0.60を超えるR 2値は価値があると見なされます。
決定係数を分析する利点
決定係数は、データセット内の予測スコアと実際のスコアセット間の相関の2乗です。 XとYのスコア間の相関の2乗として表すこともできます。Xは独立変数、Yは従属変数です。
表現に関係なく、Rの2乗が0の場合、独立変数を使用して従属変数を予測できないことを意味します。 逆に、1に等しい場合、変数の従属変数は常に独立変数によって予測されることを意味します。
この範囲内にある決定係数は、従属変数が独立変数によって予測される程度を測定します。 たとえば、0.22のR-2乗は、従属変数の20%が独立変数によって予測されることを意味します。
適合度、または線形相関の程度は、グラフ上の適合線とグラフの周りに散らばっているすべてのデータポイントとの間の距離を測定します。 データのタイトなセットには、ポイントに非常に近い回帰線があり、適合度が高くなります。つまり、線とデータ間の距離は非常に小さくなります。 適切な近似には、1に近いR-2乗があります。
ただし、R-squaredは、データポイントまたは予測がバイアスされているかどうかを判断できません。 また、決定係数の値が良いかどうかをアナリストやユーザーに伝えません。 たとえば、低いR 2乗は悪いことではなく、R 2乗数に基づいて決定を下すのは人次第です。
決定係数は、単純に解釈されるべきではありません。 たとえば、モデルのR 2乗が75%で報告される場合、その誤差の分散は従属変数の分散よりも75%小さく、その誤差の標準偏差は従属変数の標準偏差より50%小さくなります。変数。 モデルのエラーの標準偏差は、定数のみのモデルで得られるエラーの標準偏差のサイズの約3分の1です。
最後に、Rの2乗値が大きい場合でも、モデル内の説明変数の統計的有意性がない場合や、これらの変数の有効サイズが実際的には非常に小さい場合があります。