中心極限定理
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(2010年2月) |
中心極限定理(ちゅうしんきょくげんていり、英: central limit theorem, CLT)は、確率論・統計学における極限定理の一つ。
大数の法則によると、ある母集団から無作為抽出した標本の平均は標本の大きさを大きくすると母平均に近づく。これに対し中心極限定理は標本平均と母平均との誤差を論ずるものである。多くの場合、母集団の分布がどんな分布であっても、その誤差は標本の大きさを大きくしたとき近似的に正規分布に従う。
なお、標本の分布に分散が存在しないときには、極限が正規分布と異なる場合もある。
統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。
目次
1 定理
2 証明
3 正規分布に収束しないケース
4 脚注
5 参考文献
6 関連項目
定理
以下の定理はLindeberg (1922) による[1]。
期待値 μ と分散 σ2 を持つ独立同分布 ("i.i.d.") に従う確率変数列 X1, X2, … に対し Sn:=∑k=1nXk{displaystyle textstyle S_{n}:=sum _{k=1}^{n}X_{k}} とおくと、
- P(Sn−nμnσ≦α)→12π∫−∞αe−x22dx(n→∞).{displaystyle Pleft({frac {S_{n}-nmu }{{sqrt {n}}sigma }}leqq alpha right)to {frac {1}{sqrt {2pi }}}int _{-infty }^{alpha }e^{-{frac {x^{2}}{2}}}dxqquad (nto infty ).}
つまり、独立同分布に従う確率変数列の部分和を標準化すると、期待値 0, 分散 1 の正規分布 N(0, 1) に分布収束する。
従って、n が十分大きいとき近似的に、部分和 Sn = X1 + … + Xn は平均 nμ, 分散 nσ2 の正規分布 N(nµ, nσ2) に収束し、標本平均 X¯n=(X1+⋯+Xn)/n{displaystyle {bar {X}}_{n}=(X_{1}+dotsb +X_{n})/n} は平均 μ, 分散 σ2/n の正規分布 N(μ, σ2/n) に従う。
証明
中心極限定理は特性関数(とレヴィの連続性定理)を用いることにより証明できる。
{X1, …, Xn} を独立同分布に従う確率変数とする。分布の平均を µ、分散を σ2 とする。ここで部分和 Sn = X1 + … + Xn を考えると、平均と分散はそれぞれ nµ, nσ2 となる。ここで確率変数
- Zn=Sn−nμnσ2=∑j=1nXj−μnσ2=∑j=1n1nYj,{displaystyle Z_{n}={frac {S_{n}-nmu }{sqrt {nsigma ^{2}}}}=sum _{j=1}^{n}{frac {X_{j}-mu }{sqrt {nsigma ^{2}}}}=sum _{j=1}^{n}{frac {1}{sqrt {n}}}Y_{j},}
を考える。最後の式では、平均 0、分散 1 の新しい確率変数 Yj = (Xj − μ)/σ を定義した。
ここで、Zn の特性関数は
- φZn(t)=E[eitZn]=E[eit∑j=1n1nYj]=∏j=1nE[eitnYj]=∏j=1nφYj(tn)=[φY1(tn)]n{displaystyle varphi _{Z_{n}}(t)=operatorname {E} left[e^{itZ_{n}}right]=operatorname {E} left[e^{itsum _{j=1}^{n}{frac {1}{sqrt {n}}}Y_{j}}right]=prod _{j=1}^{n}operatorname {E} left[e^{i{frac {t}{sqrt {n}}}Y_{j}}right]=prod _{j=1}^{n}varphi _{Y_{j}}left({frac {t}{sqrt {n}}}right)=left[varphi _{Y_{1}}left({frac {t}{sqrt {n}}}right)right]^{n}}
最後の等式は全ての Yj が同等であることから導いた。ここで、φY1(t){displaystyle varphi _{Y_{1}}(t)} のテイラー展開を考える。以下の等式に留意すると
- φY1(0)=E[eitY1]|t=0=1{displaystyle varphi _{Y_{1}}(0)=left.operatorname {E} left[e^{itY_{1}}right]right|_{t=0}=1}
- φY1′(0)=E[iY1eitY1]|t=0=E[iY1]=iE[Y1]=0{displaystyle varphi _{Y_{1}}'(0)=left.operatorname {E} left[iY_{1}e^{itY_{1}}right]right|_{t=0}=operatorname {E} left[iY_{1}right]=ioperatorname {E} left[Y_{1}right]=0}
- φY1″(0)=E[−Y12eitY1]|t=0=E[−Y12]=−V[Y1]=−1{displaystyle varphi _{Y_{1}}''(0)=left.operatorname {E} left[-Y_{1}^{2}e^{itY_{1}}right]right|_{t=0}=operatorname {E} left[-Y_{1}^{2}right]=-operatorname {V} left[Y_{1}right]=-1}
t = 0 の近傍のテイラー展開(マクローリン展開)は
- φY1(tn)=1−t22n+ct36n3/2+o(t3),t→0{displaystyle varphi _{Y_{1}}left({frac {t}{sqrt {n}}}right)=1-{frac {t^{2}}{2n}}+c{frac {t^{3}}{6n^{3/2}}}+oleft(t^{3}right),quad trightarrow 0}
となる。ここで c は定数であり、o(t3 ) はo表記であり、t3 よりも早く 0 に収束する関数を表す。
この式と指数関数の定義
- ex=limn→∞(1+xn)n{displaystyle e^{x}=lim _{nto infty }left(1+{frac {x}{n}}right)^{n}}
を用いると、φZn(t){displaystyle varphi _{Z_{n}}left(tright)} の n→∞{displaystyle nto infty } における極限が以下のように求められる。
- φZn(t)=(1−t22n+ct36n3/2+o(t3))n→e−12t2,n→∞{displaystyle varphi _{Z_{n}}left(tright)=left(1-{frac {t^{2}}{2n}}+c{frac {t^{3}}{6n^{3/2}}}+oleft(t^{3}right)right)^{n}to e^{-{frac {1}{2}}t^{2}},quad nto infty }
最後の関数は標準正規分布 N(0, 1) の特性関数である。特性関数と確率分布の対応は一対一なので、この結果は n→∞{displaystyle nto infty } の極限で
Zn が N(0, 1) に収束することを意味する。なお、厳密に特性関数の収束と確率分布関数の収束の対応関係が成り立つことはレヴィの連続性定理により保証される。
以上により、部分和 Sn = X1 + … + Xn は正規分布 N(nµ, nσ2) に収束し、標本平均 X¯n=(X1+⋯+Xn)/n{displaystyle {bar {X}}_{n}=(X_{1}+cdots +X_{n})/n} は正規分布 N(µ, σ2/n) に収束することが証明された。
正規分布に収束しないケース
より一般化された確率理論(コルモゴロフの公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立同分布 (i.i.d.) に従う確率変数の分散(2次の中心モーメント)が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるに従い正規分布に収束する(古典的な中心極限定理が成り立つ)が、確率変数が従う分布の裾が |x|−α−1(ただし 0 < α < 2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数 α の安定分布に収束する[2]。
※なお安定分布は特性指数が 0 < α < 2 のとき分散は無限大となり、分布の裾が冪乗則に従うファットテールを有する。
脚注
^ Feller 1968, p. 244.
^ Voit, Johannes (2003). The Statistical Mechanics of Financial Markets. Springer-Verlag. p. 124. ISBN 3-540-00978-7.
参考文献
Feller, William (1968). An introduction to probability theory and its applications. I (Third ed.). John Wiley & Sons, Inc.. ISBN 0-471-25711-7.
関連項目
- 確率論
- 大数の法則
- ド・モアブル=ラプラスの定理
|