自由度とは何ですか?
自由度とは、データサンプル内の論理的に独立した値の最大数を指します。これは、変化する自由がある値です。
重要なポイント
- 自由度は、データサンプル内の論理的に独立した値の最大数を指します。これは、変化する自由がある値です。自由度は、一般に、Chi-などの統計のさまざまな形式の仮説検定に関連して説明されます。正方形:カイ二乗統計量の重要性と帰無仮説の有効性を理解しようとする場合、自由度の計算が重要です。
自由度を理解する
自由度を概念的に理解する最も簡単な方法は、例を使用することです。
- 簡単にするために、5つの正の整数で構成されるデータサンプルを考えます。 値は、それらの間に既知の関係のない任意の数にすることができます。 このデータサンプルは、理論的には5つの自由度を持ちます。サンプルの4つの数値は{3、8、5、および4}であり、データサンプル全体の平均は6であることがわかります。 5番目の数字は10でなければなりません。 変化する自由がないため、このデータサンプルの自由度は4です。
自由度の式は、データサンプルのサイズから1を引いたものに等しくなります。
。。。 Df = N-1where:Df =自由度N =サンプルサイズ
自由度は、一般にカイ二乗などの統計におけるさまざまな形式の仮説検定に関連して議論されます。 カイ二乗統計の重要性と帰無仮説の妥当性を理解しようとするとき、自由度を計算することが不可欠です。
カイ二乗検定
カイ2乗検定には2つの異なる種類があります。独立性の検定は、「性別とSATスコアの間に関係がありますか?」などの関係の質問をします。 「適合度テスト」では、「コインを100回投げると、頭が50回、尻尾が50回出ますか?」
これらのテストでは、実験内の変数とサンプルの総数に基づいて、特定の帰無仮説を拒否できるかどうかを判断するために自由度が利用されます。 たとえば、学生とコースの選択を検討する場合、30人または40人の学生のサンプルサイズは、重要なデータを生成するのに十分な大きさではない可能性があります。 400人または500人の学生のサンプルサイズを使用した調査から同じまたは類似の結果を取得する方がより有効です。
自由度の歴史
自由度の最も初期かつ最も基本的な概念は、数学者および天文学者カール・フリードリッヒ・ガウスの作品に絡み合って、1800年代初期に注目されました。 この用語の現代的な用法と理解は、彼の匿名性を保持するためにペンネームで1908年にBiometrikaで発表された彼の記事「The Probable Error of a Mean」で、英国の統計学者William Sealy Gossetによって最初に説明されました。
彼の著作では、ゴセットは「自由度」という用語を特に使用していませんでした。 しかし、彼は最終的にはスチューデントのT分布と呼ばれるものを開発する過程で、この概念について説明しました。 実際の用語は1922年まで人気がありませんでした。英国の生物学者であり統計学者のロナルドフィッシャーは、カイ二乗の開発に関するレポートとデータの公開を開始したときに「自由度」という用語を使い始めました。