分散は、データセット内の数値間の広がりの測定値です。 分散は、セット内の各数値が平均からどれだけ離れているかを測定します。
データセットチャートを使用して、さまざまなデータポイントまたは数値の線形関係を確認できます。 これを行うには、線自体から個々のデータポイントまでの距離を最小化しようとする回帰直線を描画します。 以下のチャートでは、データポイントは青い点、オレンジ色の線は回帰直線、赤い矢印は観測データと回帰直線からの距離です。
ジュリー・バンによる画像©Investopedia 2020
分散を計算するとき、これらすべてのデータポイントの関係を考慮して、次のデータポイントでどれくらいの距離が必要かを尋ねます。 この「距離」はエラー項と呼ばれ、分散が測定するものです。
分散は単位を持たないため、それ自体では分散が役に立たないことが多く、測定と比較が困難になります。 ただし、分散の平方根は標準偏差であり、測定として実用的です。
Excelで分散を計算する
データセットが既にソフトウェアに入力されている場合、Excelでの分散の計算は簡単です。 以下の例では、S&P 500に投資するSPYという非常に人気のある上場投資信託(ETF)の20日間の日次リターンの分散を計算します。
- 式は= VAR.S(データの選択)です
VAR.PではなくVAR.Sを使用する理由(これは別の公式です)は、多くの場合、測定するデータの母集団がすべて揃っていないためです。 たとえば、表にSPY ETFの履歴にすべてのリターンがある場合、人口測定VAR.Pを使用できますが、概念を説明するために過去20日間のみを測定しているため、VAR.Sを使用します。
ご覧のとおり、.000018674の計算された分散値は、データセット自体についてはほとんどわかりません。 収益の標準偏差を取得するためにその値の平方根に進んだ場合、それはより便利です。