平方和とは何ですか?
平方和は、データポイントの分散を決定するために回帰分析で使用される統計的手法です。 回帰分析の目標は、データ系列がどのように生成されたかを説明するのに役立つ可能性のある関数にデータ系列を適合させることができるかどうかを判断することです。 平方和は、データから最適な(最小の変動)関数を見つけるための数学的な方法として使用されます。
平方和の式は
。。。 n個のアイテムのセットXの場合:平方和= i = 0∑n(Xi -X)2where:Xi =セット内のi番目のアイテムX =セット内のすべてのアイテムの平均(Xi -X )=各項目の平均からの偏差
平方和は変動とも呼ばれます。
平方和から何がわかりますか?
二乗和は、平均からの偏差の尺度です。 統計では、平均は数値セットの平均であり、最も一般的に使用される中心傾向の尺度です。 算術平均は、データセット内の値を合計し、値の数で割ることによって単純に計算されます。
過去5日間のMicrosoft(MSFT)の終値は、米ドルで74.01、74.77、73.94、73.61、および73.40であったとします。 合計価格の合計は369.73ドルであるため、教科書の平均または平均価格は369.73ドル/ 5 = 73.95ドルになります。
しかし、測定セットの平均を知るだけでは必ずしも十分ではありません。 場合によっては、一連の測定値にどの程度の変動があるかを知ることが役立つことがあります。 個々の値が平均からどれだけ離れているかは、作成された回帰モデルに観測値または値がどの程度適合するかについての洞察を与えることがあります。
たとえば、MSFTの株価がAppleの価格(AAPL)と連動して動くかどうかを知りたい場合、アナリストは、特定の期間(1、2など)の両方の株式のプロセスに関する一連の観察結果をリストできます。 、または10年で、各観測または測定値を記録した線形モデルを作成します。 両方の変数間の関係(つまり、AAPLの価格とMSFTの価格)が直線でない場合は、精査する必要のあるデータセットに変動があります。
統計では、作成された線形モデルの線が価値のすべての測定値を通過しない場合、株価で観察された変動の一部は説明されません。 平方和は、2つの変数間に線形関係が存在するかどうかを計算するために使用され、説明されていない変動は残差平方和と呼ばれます。
二乗和は、変動の二乗の合計です。ここで、変動は、個々の値と平均との間の広がりとして定義されます。 平方和を決定するために、各データポイントと最適な線の間の距離が平方され、合計されます。 最適な線は、この値を最小化します。
平方和の計算方法
これで、測定値が偏差の平方和、または略して平方和と呼ばれる理由がわかります。 上記のMSFTの例を使用すると、平方和は次のように計算できます。
- SS =(74.01-73.95) 2 +(74.77-73.95) 2 +(73.94-73.95) 2 +(73.61-73.95) 2 +(73.40-73.95) 2 SS =(0.06) 2 +(0.82) 2 +(- 0.01) 2 +(-0.34) 2 +(-0.55) 2 SS = 1.0942
2乗せずに偏差の合計のみを加算すると、負の偏差は正の偏差をほぼ完全に相殺するため、ゼロに近い数値になります。 より現実的な数値を得るには、偏差の合計を2乗する必要があります。 正または負にかかわらず、任意の数の平方は常に正であるため、平方の合計は常に正の数になります。
平方和の使用方法の例
MSFT計算の結果に基づいて、高い二乗和は、ほとんどの値が平均から遠く離れているため、データに大きな変動があることを示しています。 平方和が小さいということは、観測セットのばらつきが小さいことを意味します。
上記の例では、1.0942は、過去5日間のMSFTの株価の変動性が非常に低く、価格安定性と低ボラティリティを特徴とする株式への投資を検討している投資家がMSFTを選択できることを示しています。
重要なポイント
- 二乗和は、平均値から離れたデータポイントの偏差を測定します。二乗和の結果が大きいほど、データセット内のばらつきが大きいことを示し、結果が小さいほど、データが平均値から大きく変化していることを示します。 。
平方和の使用の制限
どの株を購入するかについて投資判断を下すには、ここに挙げたものよりも多くの観察が必要です。 アナリストは、資産の変動性がどの程度高いか低いかをより確実に知るために、長年のデータを使用する必要があります。 より多くのデータポイントがセットに追加されると、値が広がるにつれて平方和が大きくなります。
最も広く使用されている変動の測定値は、標準偏差と分散です。 ただし、2つのメトリックのいずれかを計算するには、最初に平方和を計算する必要があります。 分散は、二乗和の平均(つまり、二乗和を観測数で割ったもの)です。 標準偏差は、分散の平方根です。
平方和を使用する回帰分析には、線形最小二乗法と非線形最小二乗法の2つの方法があります。 最小二乗法とは、回帰関数が実際のデータポイントからの分散の二乗和を最小化するという事実を指します。 このようにして、統計的にデータに最適な関数を描くことができます。 回帰関数は、線形(直線)または非線形(曲線)のいずれかであることに注意してください。