確率分布とは何ですか?
確率分布は、確率変数が特定の範囲内で取ることができるすべての可能な値と尤度を記述する統計関数です。 この範囲は、可能な最小値と最大値の間に制限されますが、可能性のある値が確率分布にプロットされる可能性がある正確な場所は、いくつかの要因に依存します。 これらの要因には、分布の平均(平均)、標準偏差、歪度、尖度が含まれます。
確率分布の仕組み
おそらく最も一般的な確率分布は正規分布または「ベル曲線」ですが、一般的に使用されるいくつかの分布が存在します。 通常、何らかの現象のデータ生成プロセスにより、その確率分布が決まります。 このプロセスは、確率密度関数と呼ばれます。
確率分布を使用して累積分布関数(CDF)を作成することもできます。累積分布関数は、発生の確率を累積的に加算し、常に0から始まり100%で終了します。
学者、財務アナリスト、ファンドマネージャーは、特定の株の確率分布を決定して、株が将来生じる可能性のある予想リターンを評価することができます。 在庫の返品履歴は、任意の時間間隔で測定できますが、おそらく在庫の返品の一部のみで構成され、分析はサンプリングエラーにさらされます。 サンプルサイズを増やすと、このエラーを大幅に減らすことができます。
重要なポイント
- 確率分布は、特定のデータ生成プロセスの可能な値の予想結果を表します。確率分布は、平均、標準偏差、歪度、尖度で定義されるさまざまな特性を持つ多くの形をとっています。株などのリスクをヘッジするために。
確率分布のタイプ
確率分布にはさまざまな分類があります。 それらのいくつかには、正規分布、カイ二乗分布、二項分布、およびポアソン分布が含まれます。 さまざまな確率分布はさまざまな目的に役立ち、さまざまなデータ生成プロセスを表します。 たとえば、二項分布は、指定された試行回数にわたってイベントが数回発生する確率と、各試行でのイベントの確率を評価します。 バスケットボールプレーヤーがゲームで行うフリースローの数を追跡することで生成できます。1=バスケット、0 =ミスです。 別の典型的な例は、公正なコインを使用し、そのコインが10回のストレートフリップで頭に浮かぶ確率を計算することです。 有効な応答は1または0のみであるため、二項分布は連続ではなく 離散 です。
最も一般的に使用される分布は正規分布であり、金融、投資、科学、工学で頻繁に使用されます。 正規分布は、その平均と標準偏差によって完全に特徴付けられます。つまり、分布は歪んでおらず、尖度を示しています。 これにより、分布が対称になり、プロット時に釣鐘形の曲線として描かれます。 正規分布は、ゼロの平均(平均)と1.0の標準偏差、スキュー0と尖度= 3によって定義されます。正規分布では、収集されたデータの約68%が+/- 1標準以内に収まります。平均の偏差; +/- 2標準偏差以内で約95%。 そして、3つの標準偏差内で99.7%。 二項分布とは異なり、正規分布は連続的です。つまり、可能な値はすべて表されます(0と1の間に何もない場合とは対照的に)。
投資に使用される確率分布
株式のリターンは通常、正規分布であると想定されますが、実際には、通常の分布で予測されるよりも大きな負および正のリターンが発生していると思われる尖度を示します。 実際、株価はゼロに制限されていますが、潜在的な無制限のアップサイドを提供するため、株価収益率の分布は対数正規分布として説明されています。 これは、分布の裾がより厚い厚さを持つ在庫リターンのプロットに現れます。
確率分布は多くの場合、リスク管理でも使用され、過去のリターンの分布に基づいて投資ポートフォリオが被る損失の確率と量を評価します。 投資で使用される一般的なリスク管理指標の1つは、バリューアットリスク(VaR)です。 VaRは、ポートフォリオの確率と時間枠が与えられた場合に発生する可能性のある最小損失をもたらします。 あるいは、投資家は、VaRを使用して損失額と時間枠について損失の確率を得ることができます。 VaRへの誤用と過度の依存は、2008年の金融危機の主な原因の1つとされています。
確率分布の例
確率分布の簡単な例として、2つの標準的な6面のサイコロを振ったときに観測される数を見てみましょう。 各ダイスには1〜6の任意の1つの数字を振る確率が1/6ありますが、2つのダイスの合計が下の画像に示す確率分布を形成します。 7が最も一般的な結果です(1 + 6、6 + 1、5 + 2、2 + 5、3 + 4、4 + 3)。 一方、2および12は、はるかに少ない可能性があります(1 + 1および6 + 6)。
2つのサイコロの合計の確率分布。 CKTaylor