お世話になります。 統計に関する質問があります。小生は大学4年であります。
不偏分散を(平方和)/(n-1)というようにn-1で割る理由として、「自由度がn-1」だからというものを文献などで見かけます。根拠としては、平方和を求める際に平均値x(ave)を定義しますが、その平均値が束縛条件になっている、というものです。 これは正しいのでしょうか?? データ数n(x1、x2、・・・xn)の標本を考えると、これらは確率変数であり、それから定義される標本平均もまた確率変数になるため、自由度はnではないのか??と小生は考えています。
また、この件に付随して、zを標準正規分布に従うとして、W=Σz^2=Σ{x-x(ave)}/σ^2とすると、x(ave)が束縛条件になるため、Wは自由度n-1のカイ二乗分布に従うと書かれた文献があります。しかし、x(ave)が確率変数であるため、Wの自由度はnではないのか??と思います。
小生の考えに欠陥はありますでしょうか?? よろしくお願いします。
|
No.49550 - 2018/04/01(Sun) 11:04:37
| ☆ Re: 不偏分散においてn-1で割る理由 / 黄桃 | | | きちんとした数理統計学の教科書を読むことをお勧めします。 分布の平均(あるいは分散)と標本の平均(あるいは分散)の違いも明確ではないように思います。 特に、母平均が未知であるか既知であるかがはっきり区別できていないようです。
確率変数Xの平均をμ、分散をσ^2 とし、Xの大きさnに関する標本をX[1],...,X[n]とします。 標本平均X^-=(1/n)ΣX[i], 標本分散S^2=(1/n)Σ(X[i]-X^-)^2 です。
#ご質問の文章からは x(ave)がμの意味なのかX^-の意味なのかわかりません。 #流れ的には標本平均のように思えますが、x(ave)とは別に標本平均という言葉も出てきており、 #よくわかりません。
不偏分散に関して言えば、E(S^2)を計算すれば、 (1/n)ΣE(Xi-μ)^2-E(X^- - μ)^2=σ^2-(1/n)σ^2=((n-1)/n)σ^2 (X^- -μは、平均0,分散σ^2/nの確率変数になります) となり、E(X^- - μ)^2 由来の項、すなわち、標本平均の分布に関する項があるために、S^2では不偏推定量にならないのでした。 これを修正するために、n/(n-1)を S^2に乗じたもの、つまり、(1/(n-1))Σ(X[i]-X^-)^2が不偏分散と呼ばれるのでした。
これを評して「そもそも分散とは平均からの偏りという相対的な数値であるから平均を0にしても同じことであり、これはΣX[i]=0ということだから、自由度が1つ小さい」といっているのでしょう(n=1なら推定のしようがない方が当然です)。
なお、μが既知であれば、S^2の代わりに (1/n)Σ(X[i]-μ)^2 を使えば、これは不偏推定量になり自由度nのχ2乗分布になります。
両者を混同しているように見えます。
2番目も、おそらく、 (*)「Xが分散σ^2の正規分布に従う時(平均は未知)、それから抽出された大きさnの無作為標本による標本分散S^2を S^2=(Σ(X[i]-X^-)^2)/n とすれば、nS^2/σ^2 は自由度n-1のχ2乗分布に従う」 という類のことを誤解しているのではないでしょうか。
母平均μが既知なら、上で述べたようにσ^2の推定には、Σ(Xi-μ)^2/nを使えばよく、これは、自由度nのχ^2分布に従います。
(*)のようにμが未知なら不偏分散と同様で、標本分散の分布には、(元の分布の平均を推定するために)標本平均の分布がかかわってくるので、ここ由来の項により自由度が1つ減って自由度(n-1)のχ2乗分布になるのでした。
|
No.49556 - 2018/04/01(Sun) 18:52:55 |
| ☆ Re: 不偏分散においてn-1で割る理由 / 高橋由伸 | | | 返信ありがとうございます。 ここで述べていた平均は、x(ave)を含めて標本平均の意味で使っていました。母平均との区別が曖昧な表現になってしまいすいませんでした。
黄桃様の返信の一番最後の 【(*)のようにμが未知なら不偏分散と同様で、標本分散の分布には、(元の分布の平均を推定するために)標本平均の分布がかかわってくるので、ここ由来の項により自由度が1つ減って自由度(n-1)のχ2乗分布になるのでした。】 がいまいち理解できません。
例えば、X^−=Σxi/n=(定数)となるのであれば、(連立方程式のように考えると)その式を用いてn個のxiの内から一つを消去できるため、自由度が1つ減るというのは理解できます。 しかし、X^−はあくまで確率変数であるため、X^−の式があっても、X^−という変数が新たに加わるため、あくまで自由度はnのままではないのか?という疑問を持っています。 もしくは、中心極限定理より「X^−は正規分布に従う」というのが束縛条件になっているのでしょうか??しかし、その場合でも、nが小さい場合では「X^−は正規分布に従う」とは言えないので、納得できません。
よろしくお願いします。
|
No.49562 - 2018/04/02(Mon) 01:22:21 |
| ☆ Re: 不偏分散においてn-1で割る理由 / 黄桃 | | | 後半部分は、大分省略しています。掲示板で書くには長すぎます。S^2の分布についてちゃんとした教科書を(図書館などで)読んでください。
ポイントは、Xが正規分布であれば、S^2とX^-は独立に分布するので、nS^2/σ^2のモーメント母関数が、Σ(Xi-μ)^2/σのモーメント母関数を(X^- -μ)/(σ/√n))のモーメント母関数で割ったものと計算できることです(モーメント母関数を取る前は不偏分散と同様の式です)。
こうした背景から「自由度」と呼ぶとイメージが湧き、整合性も保てると考える人が多いのでこの呼称が一般的になったとお考え下さい。最初になんらかの「自由度」という概念があると思わない方がいいと思います。
|
No.49567 - 2018/04/02(Mon) 07:58:47 |
| ☆ Re: 不偏分散においてn-1で割る理由 / 黄桃 | | | きちんとした数理統計学の教科書を読むことをお勧めします。 分布の平均(あるいは分散)と標本の平均(あるいは分散)の違いも明確ではないように思います。 特に、母平均が未知であるか既知であるかがはっきり区別できていないようです。
確率変数Xの平均をμ、分散をσ^2 とし、Xの大きさnに関する標本をX[1],...,X[n]とします。 標本平均X^-=(1/n)ΣX[i], 標本分散S^2=(1/n)Σ(X[i]-X^-)^2 です。
#ご質問の文章からは x(ave)がμの意味なのかX^-の意味なのかわかりません。 #流れ的には標本平均のように思えますが、x(ave)とは別に標本平均という言葉も出てきており、 #よくわかりません。
不偏分散に関して言えば、E(S^2)を計算すれば、 (1/n)ΣE(Xi-μ)^2-E(X^- - μ)^2=σ^2-(1/n)σ^2=((n-1)/n)σ^2 (X^- -μは、平均0,分散σ^2/nの確率変数になります) となり、E(X^- - μ)^2 由来の項、すなわち、標本平均の分布に関する項があるために、S^2では不偏推定量にならないのでした。 これを修正するために、n/(n-1)を S^2に乗じたもの、つまり、(1/(n-1))Σ(X[i]-X^-)^2が不偏分散と呼ばれるのでした。
これを評して「そもそも分散とは平均からの偏りという相対的な数値であるから平均を0にしても同じことであり、これはΣX[i]=0ということだから、自由度が1つ小さい」といっているのでしょう(n=1なら推定のしようがない方が当然です)。
なお、μが既知であれば、S^2の代わりに (1/n)Σ(X[i]-μ)^2 を使えば、これは不偏推定量になり自由度nのχ2乗分布になります。
両者を混同しているように見えます。
2番目も、おそらく、 (*)「Xが分散σ^2の正規分布に従う時(平均は未知)、それから抽出された大きさnの無作為標本による標本分散S^2を S^2=(Σ(X[i]-X^-)^2)/n とすれば、nS^2/σ^2 は自由度n-1のχ2乗分布に従う」 という類のことを誤解しているのではないでしょうか。
母平均μが既知なら、上で述べたようにσ^2の推定には、Σ(Xi-μ)^2/nを使えばよく、これは、自由度nのχ^2分布に従います。
(*)のようにμが未知なら不偏分散と同様で、標本分散の分布には、(元の分布の平均を推定するために)標本平均の分布がかかわってくるので、ここ由来の項により自由度が1つ減って自由度(n-1)のχ2乗分布になるのでした。
|
No.49556 - 2018/04/01(Sun) 18:52:55 |
| ☆ Re: 不偏分散においてn-1で割る理由 / 高橋由伸 | | | 返信ありがとうございます。 ここで述べていた平均は、x(ave)を含めて標本平均の意味で使っていました。母平均との区別が曖昧な表現になってしまいすいませんでした。
黄桃様の返信の一番最後の 【(*)のようにμが未知なら不偏分散と同様で、標本分散の分布には、(元の分布の平均を推定するために)標本平均の分布がかかわってくるので、ここ由来の項により自由度が1つ減って自由度(n-1)のχ2乗分布になるのでした。】 がいまいち理解できません。
例えば、X^−=Σxi/n=(定数)となるのであれば、(連立方程式のように考えると)その式を用いてn個のxiの内から一つを消去できるため、自由度が1つ減るというのは理解できます。 しかし、X^−はあくまで確率変数であるため、X^−の式があっても、X^−という変数が新たに加わるため、あくまで自由度はnのままではないのか?という疑問を持っています。 もしくは、中心極限定理より「X^−は正規分布に従う」というのが束縛条件になっているのでしょうか??しかし、その場合でも、nが小さい場合では「X^−は正規分布に従う」とは言えないので、納得できません。
よろしくお願いします。
|
No.49562 - 2018/04/02(Mon) 01:22:21 |
| ☆ Re: 不偏分散においてn-1で割る理由 / 黄桃 | | | 後半部分は、大分省略しています。掲示板で書くには長すぎます。S^2の分布についてちゃんとした教科書を(図書館などで)読んでください。
ポイントは、Xが正規分布であれば、S^2とX^-は独立に分布するので、nS^2/σ^2のモーメント母関数が、Σ(Xi-μ)^2/σのモーメント母関数を(X^- -μ)/(σ/√n))のモーメント母関数で割ったものと計算できることです(モーメント母関数を取る前は不偏分散と同様の式です)。
こうした背景から「自由度」と呼ぶとイメージが湧き、整合性も保てると考える人が多いのでこの呼称が一般的になったとお考え下さい。最初になんらかの「自由度」という概念があると思わない方がいいと思います。
|
No.49567 - 2018/04/02(Mon) 07:58:47 |
|