Yrurtj

サイコロを

n

回振ったときの出た目の和

S n = X 1 + \dots + X n

の分布が

n

を大きくするに従って正規分布による近似に近づく様子

中心極限定理（ちゅうしんきょくげんていり、英: central limit theorem, CLT）は、確率論・統計学における極限定理の一つ。

大数の法則によると、ある母集団から無作為抽出した標本の平均は標本の大きさを大きくすると母平均に近づく。これに対し中心極限定理は標本平均と母平均との誤差を論ずるものである。多くの場合、母集団の分布がどんな分布であっても、その誤差は標本の大きさを大きくしたとき近似的に正規分布に従う。

なお、標本の分布に分散が存在しないときには、極限が正規分布と異なる場合もある。

統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。

定理

以下の定理はLindeberg (1922) による^[1]。

期待値 $μ$ と分散 $σ 2$ を持つ独立同分布 ("i.i.d.") に従う確率変数列 $X 1, X 2, \dots$ に対し ${displaystyle textstyle S_{n}:=sum _{k=1}^{n}X_{k}}$ とおくと、

{displaystyle Pleft({frac {S_{n}-nmu }{{sqrt {n}}sigma }}leqq alpha right)to {frac {1}{sqrt {2pi }}}int _{-infty }^{alpha }e^{-{frac {x^{2}}{2}}}dxqquad (nto infty ).}

つまり、独立同分布に従う確率変数列の部分和を標準化すると、期待値 $0$ , 分散 $1$ の正規分布 $N (0, 1)$ に分布収束する。

従って、 $n$ が十分大きいとき近似的に、部分和 $S n = X 1 + \dots + X n$ は平均 $nμ$ , 分散 $nσ 2$ の正規分布 $N (nµ, nσ 2)$ に収束し、標本平均 ${displaystyle {bar {X}}_{n}=(X_{1}+dotsb +X_{n})/n}$ は平均 $μ$ , 分散 $σ 2 / n$ の正規分布 $N (μ, σ 2 / n)$ に従う。

証明

中心極限定理は特性関数（とレヴィの連続性定理（英語版））を用いることにより証明できる。

${X 1, \dots, X n}$ を独立同分布に従う確率変数とする。分布の平均を $µ$ 、分散を $σ 2$ とする。ここで部分和 $S n = X 1 + \dots + X n$ を考えると、平均と分散はそれぞれ $nµ$ , $nσ 2$ となる。ここで確率変数

{displaystyle Z_{n}={frac {S_{n}-nmu }{sqrt {nsigma ^{2}}}}=sum _{j=1}^{n}{frac {X_{j}-mu }{sqrt {nsigma ^{2}}}}=sum _{j=1}^{n}{frac {1}{sqrt {n}}}Y_{j},}

を考える。最後の式では、平均 $0$ 、分散 $1$ の新しい確率変数 $Y j = (X j - μ)/ σ$ を定義した。
ここで、 $Z n$ の特性関数は

{displaystyle varphi _{Z_{n}}(t)=operatorname {E} left[e^{itZ_{n}}right]=operatorname {E} left[e^{itsum _{j=1}^{n}{frac {1}{sqrt {n}}}Y_{j}}right]=prod _{j=1}^{n}operatorname {E} left[e^{i{frac {t}{sqrt {n}}}Y_{j}}right]=prod _{j=1}^{n}varphi _{Y_{j}}left({frac {t}{sqrt {n}}}right)=left[varphi _{Y_{1}}left({frac {t}{sqrt {n}}}right)right]^{n}}

最後の等式は全ての $Y j$ が同等であることから導いた。ここで、 ${displaystyle varphi _{Y_{1}}(t)}$ のテイラー展開を考える。以下の等式に留意すると

{displaystyle varphi _{Y_{1}}(0)=left.operatorname {E} left[e^{itY_{1}}right]right|_{t=0}=1}

{displaystyle varphi _{Y_{1}}'(0)=left.operatorname {E} left[iY_{1}e^{itY_{1}}right]right|_{t=0}=operatorname {E} left[iY_{1}right]=ioperatorname {E} left[Y_{1}right]=0}

{displaystyle varphi _{Y_{1}}''(0)=left.operatorname {E} left[-Y_{1}^{2}e^{itY_{1}}right]right|_{t=0}=operatorname {E} left[-Y_{1}^{2}right]=-operatorname {V} left[Y_{1}right]=-1}

$t = 0$ の近傍のテイラー展開（マクローリン展開）は

{displaystyle varphi _{Y_{1}}left({frac {t}{sqrt {n}}}right)=1-{frac {t^{2}}{2n}}+c{frac {t^{3}}{6n^{3/2}}}+oleft(t^{3}right),quad trightarrow 0}

となる。ここで $c$ は定数であり、 $o (t 3)$ はo表記であり、 $t 3$ よりも早く $0$ に収束する関数を表す。
この式と指数関数の定義

{displaystyle e^{x}=lim _{nto infty }left(1+{frac {x}{n}}right)^{n}}

を用いると、 ${displaystyle varphi _{Z_{n}}left(tright)}$ の $nto infty$ における極限が以下のように求められる。

{displaystyle varphi _{Z_{n}}left(tright)=left(1-{frac {t^{2}}{2n}}+c{frac {t^{3}}{6n^{3/2}}}+oleft(t^{3}right)right)^{n}to e^{-{frac {1}{2}}t^{2}},quad nto infty }

最後の関数は標準正規分布 $N (0, 1)$ の特性関数である。特性関数と確率分布の対応は一対一なので、この結果は $nto infty$ の極限で
$Z n$ が $N (0, 1)$ に収束することを意味する。なお、厳密に特性関数の収束と確率分布関数の収束の対応関係が成り立つことはレヴィの連続性定理（英語版）により保証される。

以上により、部分和 $S n = X 1 + \dots + X n$ は正規分布 $N (nµ, nσ 2)$ に収束し、標本平均 ${displaystyle {bar {X}}_{n}=(X_{1}+cdots +X_{n})/n}$ は正規分布 $N (µ, σ 2 / n)$ に収束することが証明された。

正規分布に収束しないケース

より一般化された確率理論（コルモゴロフの公理）では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立同分布 (i.i.d.) に従う確率変数の分散（2次の中心モーメント）が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるに従い正規分布に収束する（古典的な中心極限定理が成り立つ）が、確率変数が従う分布の裾が $| x | -α-1$ （ただし $0 < α < 2$ ）のべき乗で減衰する場合（分布の裾が厚くなり分散は無限大に発散して）（正規分布には収束せず）特性指数 $α$ の安定分布に収束する^[2]。

※なお安定分布は特性指数が $0 < α < 2$ のとき分散は無限大となり、分布の裾が冪乗則に従うファットテールを有する。

脚注

[ヘルプ]

^ Feller 1968, p. 244.

^ Voit, Johannes (2003). The Statistical Mechanics of Financial Markets. Springer-Verlag. p. 124. ISBN 3-540-00978-7.

参考文献

Feller, William (1968). An introduction to probability theory and its applications. I (Third ed.). John Wiley & Sons, Inc.. ISBN 0-471-25711-7.

搜尋此網誌

Yrurtj

中心極限定理

目次

定理

証明

正規分布に収束しないケース

脚注

参考文献

関連項目

Popular posts from this blog

濃尾地震

陸軍士官学校卒業生一覧 (日本)

宮崎県