正規分布式は、特定のデータセットの特性を定量化する2つの単純なパラメーター(平均と標準偏差)に基づいています。 平均はデータセット全体の「中心」または平均値を示しますが、標準偏差はその平均値の周りのデータポイントの「広がり」または変動を示します。
次の2つのデータセットを検討してください。
データセット1 = {10、10、10、10、10、10、10、10、10、10、10}
データセット2 = {6、8、10、12、14、14、12、10、8、6}
Dataset1の場合、平均= 10および標準偏差(stddev)= 0
Dataset2の場合、平均= 10および標準偏差(stddev)= 2.83
DataSet1のこれらの値をプロットしましょう。
DataSet2の場合も同様:
上記の両方のグラフの赤い水平線は、各データセットの「平均」または平均値を示します(両方の場合とも10)。 2番目のグラフのピンクの矢印は、平均値からのデータ値の広がりまたは変動を示しています。 これは、DataSet2の場合、標準偏差値2.83で表されます。 DataSet1にはすべて同じ値(それぞれ10)があり、バリエーションがないため、stddev値はゼロであり、したがってピンクの矢印は適用できません。
stddev値には、データ分析に非常に役立ついくつかの重要で有用な特性があります。 正規分布の場合、データ値は平均の両側に対称的に分布します。 正規分布データセットの場合、水平軸にstddevを使用してグラフをプロットします。 縦軸のデータ値の場合、次のグラフが得られます。
正規分布のプロパティ
- 正規曲線は平均に関して対称です;平均は中央にあり、面積を2つの半分に分割します;曲線= 0の合計面積は平均= 0およびstdev = 1で1に等しくなります;分布はその平均によって完全に記述されますおよびstddev
上記のグラフからわかるように、stddevは以下を表します。
- データ値の68.3%は平均の1標準偏差内(-1〜+1)データ値の95.4%は平均の2標準偏差内(-2〜+2)データ値の99.7%は3標準偏差内平均の(-3〜+3)
ベル形の曲線の下の領域は、測定された場合、特定の範囲の望ましい確率を示します。
- X未満:–たとえば、データ値が70未満である確率がXより大きい–たとえば、データ値が95 を超える確率がX 1とX 2である –たとえば、データ値が65〜85である確率
Xは対象の値です(以下の例)。
データセットが異なると平均値と標準偏差値も異なるため、面積のプロットと計算は必ずしも便利ではありません。 簡単な計算と実世界の問題への適用のための統一された標準方法を促進するために、Z値への標準変換が導入されました。これは正規分布表の一部を形成します。
Z =(X –平均)/ stddev、ここでXはランダム変数です。
基本的に、この変換により、平均値と標準偏差がそれぞれ0と1に標準化されます。これにより、標準定義のZ値セット( 正規分布テーブルから )を簡単な計算に使用できます。 確率値を含む標準Z値テーブルのスナップショットは次のとおりです。
z |
0.00 |
0.01 |
0.02 |
0.03 |
0.04 |
0.05 |
0.06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0.05172 |
0.05567 |
0.05966 |
… |
0.2 |
0.0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0.11791 |
0.12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0.5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0.23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
0.239865のz値に関連する確率を見つけるには、最初に小数点以下2桁(つまり0.24)に丸めます。 次に、行の最初の2つの有効数字(0.2)と列の最下位の数字(残り0.04)を確認します。 これにより、0.09483の値になります。
確率値(負の値を含む)の小数点以下5桁までの精度を持つ完全な正規分布表は、ここにあります。
いくつかの実際の例を見てみましょう。 大規模なグループの個人の身長は、正規分布パターンに従います。 身長が記録され、平均と標準偏差がそれぞれ66インチと6インチに計算される100人の個人のセットがあるとします。
以下に、Z値テーブルを使用して簡単に回答できる質問の例をいくつか示します。
- グループの人が70インチ以下である確率はどのくらいですか?
問題は、 P(X <= 70)の累積値、つまり100のデータセット全体で、0〜70の間の値の数を見つけることです。
まず、70のX値を同等のZ値に変換しましょう。
Z =(X –平均)/ stddev =(70-66)/ 6 = 4/6 = 0.66667 = 0.67(小数点以下2桁まで)
ここで、P(Z <= 0.67)= 0を見つける必要があります。24857(上記のzテーブルから)
つまり、グループ内の個人が70インチ以下になる確率は24.857%です。
しかし、ちょっと待ってください。上記は不完全です。 覚えておいて、我々は70までのすべての可能な高さ、すなわち0から70までの確率を探していることを思い出してください。 正解を得るには、残りの半分(0〜66)を含める必要があります。
0から66は半分の部分(つまり、1つの極端から中間の平均)を表すため、その確率は単に0.5です。
したがって、人が70インチ以下になる正しい確率= 0.24857 + 0.5 =0。74857 = 74.857%
グラフィカルに(面積を計算して)、これらは解を表す2つの合計領域です。
- 人が75インチ以上である確率はどのくらいですか?
すなわち、 相補 累積 P(X> = 75)を検索します。
Z =(X –平均)/ stddev =(75-66)/ 6 = 9/6 = 1.5
P(Z> = 1.5)= 1- P(Z <= 1.5)= 1 –(0.5 + 0.43319)= 0.06681 = 6.681%
- 人が52インチから67インチの間に入る確率はどのくらいですか?
P(52 <= X <= 67)を見つけます。
P(52 <= X <= 67)= P = P(-2.33 <= Z <= 0.17)
= P(Z <= 0.17)–P(Z <= -0.233)=(0.5 + 0.56749)-(.40905)=
この正規分布表 (およびz値)は、一般に、株式およびインデックスの株式市場での予想価格変動に関する確率計算に使用されます。 それらは、レンジベースの取引で使用され、上昇または下降トレンド、サポートまたはレジスタンスレベル、および平均および標準偏差の正規分布概念に基づく他の技術指標を識別します。
投資口座の比較×この表に表示されるオファーは、Investopediaが報酬を受け取るパートナーシップからのものです。 プロバイダー名説明関連記事
トレーディング基礎教育
金融における仮説検定:概念と例
危機管理
正規分布を使用してポートフォリオを最適化する
テクニカル分析基礎教育
時間と価格の線形回帰
危機管理
ボラティリティの用途と限界
財務分析
Excelでバリューアットリスク(VaR)を計算する方法
基礎分析のためのツール