Excelで線形回帰モデルを作成する方法

線形回帰とは何ですか？

線形回帰は、独立変数と従属変数の間の線形関係をグラフ化するデータプロットです。通常、関係の強さと結果の分散を視覚的に示すために使用されます。これらはすべて、従属変数の動作を説明する目的で使用されます。

食べたアイスクリームの量と肥満の関係の強さをテストしたいとします。独立変数であるアイスクリームの量を取得し、それを従属変数である肥満に関連付けて、関係があるかどうかを確認します。回帰がこの関係のグラフィック表示であるとすると、データの変動性が低いほど、関係が強くなり、回帰直線への適合がより厳密になります。

重要なポイント

線形回帰は、従属変数と独立変数の関係をモデル化します。変数が独立しており、不均一分散性がなく、変数の誤差項が相関していない場合、回帰分析を実現できます。データ分析ツールパック。

重要な考慮事項

回帰分析を進めるには、データセットについていくつかの重要な前提条件が満たされている必要があります。

変数は（カイ2乗検定を使用して）真に独立している必要があります。データに異なる誤差分散があってはなりません（これは不均一分散（別名不均一分散とも呼ばれます）。各変数の誤差項は無相関でなければなりません。そうでない場合は、変数が連続的に相関していることを意味します。

これらの3つのことが複雑に聞こえる場合、それらは複雑です。しかし、これらの考慮事項の1つが真実ではないという影響は、偏った推定値です。基本的に、測定している関係を誤って述べます。

Excelで回帰を出力する

Excelで回帰分析を実行する最初のステップは、無料のExcelプラグインData Analysis ToolPakがインストールされていることを再確認することです。このプラグインにより、統計の範囲を非常に簡単に計算できます。線形回帰線をグラフ化する必要はありませんが、統計表の作成が簡単になります。インストールされているかどうかを確認するには、ツールバーから「データ」を選択します。「データ分析」がオプションの場合、機能がインストールされ、使用する準備ができています。インストールされていない場合は、Officeボタンをクリックして[Excelオプション]を選択すると、このオプションを要求できます。

Data Analysis ToolPakを使用すると、数回クリックするだけで回帰出力を作成できます。

独立変数はXの範囲に入ります。

S&P 500のリターンを考慮して、Visa（V）のストックリターンの強さと関係を推定できるかどうかを知りたいとします。 Visa（V）在庫は、列1に従属変数としてデータを返します。 S&P 500は、列2のデータを独立変数として返します。

ツールバーから「データ」を選択します。「データ」メニューが表示されます。「データ分析」を選択します。データ分析-分析ツールダイアログボックスが表示されます。メニューから「回帰」を選択し、「OK」をクリックします。回帰ダイアログボックスで、「入力Y範囲」ボックスをクリックし、従属変数データ（Visa（V）ストック「入力X範囲」ボックスをクリックし、独立変数データを選択します（S&P 500が戻ります）。「OK」をクリックして結果を実行します。

結果を解釈する

そのデータを使用して（R-squaredの記事と同じ）、次の表を取得します。

R ²値は、決定係数とも呼ばれ、独立変数によって説明される従属変数の変動の割合、または回帰モデルがデータにどの程度適合するかを測定します。 R ^2の値の範囲は0〜1で、値が大きいほど適合度が高いことを示します。 p値または確率値も0から1の範囲であり、検定が有意であるかどうかを示します。 R ²値とは対照的に、p変数は、従属変数と独立変数との相関関係を示すため、小さい方が好ましいです。

Excelで回帰をグラフ化する

データを強調表示し、散布図としてグラフ化することにより、Excelで回帰をグラフ化できます。回帰線を追加するには、「グラフツール」メニューから「レイアウト」を選択します。ダイアログボックスで、「トレンドライン」を選択してから、「線形トレンドライン」を選択します。 R ²値を追加するには、「トレンドライン」メニューから「その他のトレンドラインオプション」を選択します。最後に、「チャートにR 2乗値を表示」を選択します。上記の表と同じくらい詳細です。

目次: