[ 掲示板に戻る ]

記事No.53932に関するスレッドです

大学初級の統計学について / 雫
母分散の式がn-1で割られる理由を調べていると、画像の説明をみました。
標本分散の平均=母分散-標本平均の分散 と表される理由がわからないです。分散なので、大きい時も小さい時もあると思うので、なぜ必ず引かれる(母分散の方が大きいと言える)のかわかりません。
教えて下さい、よろしくお願いいたします。

No.53932 - 2018/09/21(Fri) 22:40:25

Re: 大学初級の統計学について / GandB
 無作為抽出して得られる標本の平均値は正規分布にしたがう。ということは巨大な母集団のデータから最大値や最小値に近いデータが標本として選ばれる確率は極めて小さい。したがって、直感的には巨大な母集団のバラツキが、無作為抽出して得られる標本のバラツキより大きいのは当たり前だということになる。

 式で一応証明したのだけどミスがあったので後ほどアップ(笑)。

No.53935 - 2018/09/22(Sat) 08:38:54

Re: 大学初級の統計学について / s
まず,
> 母分散の式がn-1で割られる
ではなく,「不偏分散の式が」ですね

どうも "母分散" と "標本分散" の違いでまず混乱されているように感じます
"母分散" は母集団の確率分布を特徴づける母数,すなわちただの数です.
一方 "標本分散" は標本の選び方に依存して変化する「確率変数」です.見るたびに変化するような数といってもいいです.

確率変数である "標本分散" に対しては,その平均や分散を考えることができます.
件の教科書の主張は「確率変数である標本分散s^2の平均は,母分散(ただの数)の(n-1)/n倍になる」と言っているわけです
この主張の,式変形による証明を書くことは簡単ですが,どんな教科書にも載っているでしょうし,そもそも「標本分散は確率変数なんだ」と認識することがまず重要なので割愛します


ちなみに直感的に標本分散s^2の平均が母分散より小さくなりそうだということは,具体的な例を考えれ見れば納得できます

母分布を「-1, 1のみを値に取る分布.-1と1は等確率で現れる」としましょう.
この分布の平均(母平均)は明らかに0で
分散(母分散)はσ^2 = (-1)^2 * (1/2) + 1^2 * (1/2) = 1です

さて,この分布に従うn=2の無作為抽出標本を考えましょう
無作為抽出なので
1) -1, -1 と2度-1を選ぶ
2) -1, 1 をそれぞれ選ぶ
3) 1, 1 と2度1を選ぶ
というパターンがあります
2)のパターンの場合,標本分散s^2は1
1)もしくは3)のパターンの場合は,標本分散s^2は0ですね?
ということは「標本分散の平均」は0と1の間の数になることがわかります.これは母分散σ^2=1より小さいですね.

No.53936 - 2018/09/22(Sat) 10:32:55

Re: 大学初級の統計学について / s
ちなみに
> 無作為抽出して得られる標本の平均値は正規分布にしたがう。
というのは誤りです.この問題は分布の形状に関係のない事実であり,正規分布かどうかは関係がないです.事実,先の回答の最後に挙げた例は正規分布ではないです.(標本の平均値も!)


雫さんは何度も統計の質問をくりかえしていますが,その一つの原因は言葉の定義の理解が甘いところにあると思います.
繰り返しますが,確率・統計を勉強する上で特に重要なのは
"数(実数・母数) と 確率変数"
の違いを理解することです

例えばよく「平均」という言葉が登場すると思いますが,
「平均1の正規分布」の「平均」
「標本分散s^2の平均」の「平均」
では全く意味が異なることを理解していますか?
前者は数(母平均)で,後者は確率変数の平均(期待値といってもいい)です
他にも「標本平均の平均」なんて言葉もあり得ますが,これに関しても正しく理解できていて他人に説明できるまでになっている必要があります

No.53937 - 2018/09/22(Sat) 10:40:49

Re: 大学初級の統計学について / GandB
> > 無作為抽出して得られる標本の平均値は正規分布にしたがう。
> というのは誤りです.この問題は分布の形状に関係のない事実であり,
> 正規分布かどうかは関係がないです.事実,先の回答の最後に挙げた
> 例は正規分布ではないです.(標本の平均値も!)

 失礼しました。私も手元にある確率・統計の参考書を久しぶりに見直すことにします。統計はExcel頼りになってるんで(笑)。

No.53938 - 2018/09/22(Sat) 11:02:41

Re: 大学初級の統計学について / GandB
 不偏分散の期待値の証明は参考書に必ず載っているので、それを参考にしてもらうとして、ここでは

> 分散なので、大きい時も小さい時もあると思うので、なぜ必ず引かれる
> (母分散の方が大きいと言える)のかわかりません。


を勝手に忖度して(笑)

「(不偏分散ではない)標本分散の平均が、母集団の分散より大きくなることはないのはなぜか」

という質問に対する回答とする。
 統計の本に目を通したのは実に久しぶりだったので、間違いがあればドシドシ指摘されたい。その方が勉強になります。何しろ忘れていることが、それはそれは多い(笑)。

 ここの常連回答者の皆さんの投稿はいろいろ参考になって、大変ありがたい。改めて感謝致します。

 さて、忖度質問は
 μを母平均、X1 ,X2 ,……, Xn を標本としたとき
  m = (X1 + X2 + …… + Xn)/n
に対し
  ( (X1-μ)^2 + (X2-μ)^2 + …… +(Xn-μ)^2 )/n
    ≧ ( (X1-m)^2 + (X2-m)^2 + …… + (Xn-m)^2 )/n

が証明できればよい。そのために、適当な正の実数 t に対し

  f(t) = ( (X1-t)^2 + (X2-t)^2 + … + (Xn-t)^2 )/n

とし、変形すると
  f(t) = ( (X1)^2 + (X2)^2 + … + (Xn)^2 + nt^2 - 2t(X1 + X2 + …… Xn) )/n
     = ( (X1)^2 + (X2)^2 + … + (Xn)^2 + nt^2 - 2tnm )/n
なので
  f'(t) = (2nt - 2nm)/n = 0.  2nt = 2nm.  ∴t = m.
 f(t) は下に凸な関数なので t = m のとき最小値をとる。

 したがって
  X1, X2, ……, Xn
がどんな値であっても(どんな選び方をしても)、

  ( (X1-μ)^2 + (X2-μ)^2 + …… +(Xn-μ)^2 )/n
    ≧ ( (X1-m)^2 + (X2-m)^2 + …… + (Xn-m)^2 )/n

が成り立つ。

No.53939 - 2018/09/22(Sat) 15:55:36

Re: 大学初級の統計学について / 雫
皆さんありがとうございました。頑張って勉強します!
No.53951 - 2018/09/23(Sun) 20:19:13