Normal dağılım

Normal
	Olasılık yoğunluk fonksiyonu; ; Standard normal dağılım yeşil çizgi ile gösterilir
	Yığmalı dağılım fonksiyonu; ; Renkler yukarıdaki gösterim ile aynıdır
Parametreler	konum (reel); kare ölçek (reel)
Destek
Olasılık yoğunluk fonksiyonu (OYF)
Birikimli dağılım fonksiyonu (YDF)
Ortalama
Medyan
Mod
Varyans
Çarpıklık	0
Fazladan basıklık	0
Entropi
Moment üreten fonksiyon (mf)
Karakteristik fonksiyon

Normal dağılım, aynı zamanda Gauss dağılımı veya Gauss tipi dağılım olarak isimlendirilen, birçok alanda pratik uygulaması olan, çok önemli bir sürekli olasılık dağılım ailesidir.

Bu dağılım ailesinin her bir üyesi sadece iki parametreyle tam olarak tanımlanabilir: Bunlar konum gösteren ortalama (μ, aritmetik ortalama) ve ölçek gösteren varyans (σ², "yayılım")dır.

Standart normal dağılım, ortalama değeri 0 ve varyans değeri 1 olan normal dağılım ailesinin tek bir elemanıdır. Carl Friedrich Gauss bu dağılımlar grubu ile, astronomik verileri analiz etmekte iken, ilgilenmiş ve bu dağılım için olasılık yoğunluk fonksiyonunu ilk defa tanımlamıştır.^[1] Bu olasılık fonksiyonunun grafiği, bir çana benzediği için çoğu kez çan eğrisi olarak da anılmaktadır.

Doğa ve davranış bilimleri içinde bulunan birçok fenomenin niceliksel modeli yapılmasında normal dağılımın kullanılmasına neden merkezsel limit teoreminin uygulanmasından doğmaktadır. Birçok psikolojik ölçümler ve fiziksel fenomen normal dağılım kullanılarak çok iyi yaklaşık olarak açıklanmaktadır. Bu fenomenlerin altında yatan mekanizmalar çoğu zaman bilinmemekte fakat normal dağılım modelinin açıklamada uygulanmaktadır. Bunun pratik yaklaşımın teorik olarak savunması ise her bir reel gözlemin oluşması için geri planda çok sayıda birbirinden bağımsız etkilerin ayrı ayrı toplam olarak katkıda bulundukları varsayımıdır.

Normal dağılım istatistik biliminin birçok alanında kullanılmaktadır. Örneğin örneklem ortalaması için örnek dağılımı, örneğin kaynağı olan anakütle için dağılımın normal olmadığı gayet açık olsa bile, yaklaşık olarak normal dağılım göstermektedir. Bunun yanında, değerleri bilinen ortalaması ve varyansı olan bütün dağılımlar içinde enformasyon entropisini maksimum yapan dağılımın normal olduğu ispat edilmiştir. Böylece örnek ortalaması ve varyansı ile özetlenen her veri için bilinmeyen kaynak dağılımı olarak normal dağılımı kullanmak gayet doğal bir yaklaşım olması çok uygun bir davranıştır. İstatistikte kullanılan dağılımlar aileleri arasında normal dağılım pratikte en çok kullanılanıdır ve birçok istatistiksel test, normal dağılımın varolduğu varsayımına dayanılarak geliştirilmiştir ve kullanılmaktadır. Olasılık kuramı içinde birkaç sürekli olasılık dağılımları ve ayrık olasılık dağılımlarının limite giden dağılımları yani rassal değişkenlerin yakınsama analizinde kullanılmaktadır.

Tarihçe

İstatistik ve olasılığın önemli dağılımlarından biri olan normal dağılım, ilk olarak 1733'te Abraham de Moivre tarafından yayınlanan bir yazıda ilk ortaya çıkartılmıştır ve 1738'de yayınlanan The Doctrine of Chances (Şanslar Doktrini) adlı kitabının ikinci baskısında p değişmemek koşuluyla n değerinin artısıyla binom dağılımının limit şekli yaklaşım olarak gösterilmiştir. De Moivre'in bu sonucu Laplace tarafından 1812'de bastırılan Analytical Theory of Probabilities (Olasılıklar İçin Analitik Teori) geliştirilmiştir ve bu sonuç şimdi de Moivre-Laplace teoremi olarak isimlendirilmektedir.

Laplace normal dağılımı incelemekte olduğu deneylemelerde hataların analizi konusunda uygulamıştır. 1805'te Legendre çok önemli olan en küçük kareler yöntemini ortaya atmıştır. Gauss, bu yöntemi1794'ten beri kullandığını iddia etmiştir ama en kesin surette hataların normal dağılımı varsayımı ile birlikte yayınladığı eser 1809'dadır.

Çan eğrisi teriminin ilk kullanılışı Jouffret tarafından 1875'te bir bağımsız parçalardan oluşan ikideğişirli normal hakkında yazıda çan yüzeyi teriminin kullanmasına kadar götürülebilir. Normal dağılım sözcüğü iseCharles S. Peirce, Francis Galton ve Wilhelm Lexis tarafından ayrı ayrı 1875 civarlarında ortaya atılmıştır.

Bu dağılıma normal adı vermek bazen hatalı görülmektedir; çünkü bazı hallerde diğer dağılımlar pratiğe çok daha uygunluk göstermektedirler.

Karakteristikler

Bir olasılık dağılımını çeşitli şekilde matematiksel ifadelerle karakterize etmek mümkündür. Bunlar arasında göze en iyi hitap edeni olasılık yoğunluk fonksiyonu ile olur. Dağılımın özellikleri ayrıca birikimli dağılım fonksiyonu,momentler, kümülantlar, karakteristik fonksiyon, moment üreten fonksiyon, kümülant üreten fonksiyon ve Maxwell'in teoremi vasıtasıyla da belirtilebilir. Bu kavramların ayrıntıları için olasılık dağılımları maddesine bakınız.

Matematiksel notasyon kullanılması ile, X rassal değeri için ortalama değeri μ ve varyansı σ² ≥ 0, olan bir normal dağılımın bulunduğu şöyle ifade edilir:

X\sim N(\mu ,\sigma ^{2}).\,\!

Normal dağılım için fazla kullanılmayan bir değişik parametreleme şekli de bulunmaktadır. Bu (bir üssü varyans yani 1/ σ²), değerine eşit olan kesinlik parametresi τ kullanılarak yapılır. Bunun avantajı sıfır değerine çok yakın varyans (σ²) değerlerinin böler olmalarından doğan limit problemlerinden ayrılma imkânı sağlaması ve normal dağılımı bir üstel ailesi bireyi olarak kullanılması gerektiği halde ortaya çıkar.

Bazı merkezsel limit teoremleri için (örneğin kestirimlerin asimtotik normalliği) Gauss tipi süreçler teorisi kullanışlı olmakla beraber, tüm olasılığı μ etrafında konsantre eden ve bir normal dağılıma benzer olarak ortalama μ ve varyans σ² = 0 değerleri bulunan Dirac ölçümü bir normal dağılım olarak kabul edilmemektedir; buna matematiksel açıklama bu ölçümde Lebesque ölçümü kurallarına göre gereken yoğunluğun bulunmamasıdır.

Olasılık yoğunluk fonksiyonu

Normal dağılım için olasılık yoğunluk fonksiyonu

Normal dağılım için sürekli olasılık yoğunluk fonksiyonu şu Gauss-tipi fonksiyondur:

\varphi _{\mu ,\sigma ^{2}}(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}={\frac {1}{\sigma }}\varphi \left({\frac {x-\mu }{\sigma }}\right),\quad x\in \mathbb {R} ,

Burada σ > 0 standart sapmadır; bir reel parametre olan μ beklenen değerdir; ve

\varphi (x)=\varphi _{0,1}(x)={\frac {1}{\sqrt {2\pi \,}}}\,e^{-{\frac {x^{2}}{2}}},\quad x\in \mathbb {R} ,

ifadesi standart normal dağılım için yoğunluk fonksiyonudur. Standart normal dağılım μ = 0 ve σ = 1 parametreleri olan bir normal dağılımdır.

\varphi _{\mu ,\sigma ^{2}}

ifadesinin reel doğru üzerindeki integral değeridir. (Ayrıntıları için Gauss-tipi entegral maddesine bakınız.)

Olasılık yoğunluk fonksiyonunun özellikleri arasında şunlar başta gelenlerdir:

ortalama değer μ etrafında simetrik olma;
hem modun hem de medyanın ortalama μ değerine eşit olması;
yoğunluk eğrisinin üzerindeki, ortalamadan birer standart sapma altında ve üstündeki noktalar arasında (yani μ - σ ve μ+σ noktalarında) bir ''enfleksyon'' noktası bulunması.

Birikimli dağılım fonksiyonu

Normal dağılım için birikimli dağılım fonksiyonu

Bir olasılık dağılımı için birikimli dağılım fonksiyonu, bir rassal değişken X için olay olasılığının dağılımının x sayısına eşit veya daha düşük olmasına kadar değerlendirilmesinden ortaya çıkar. Normal dağılım için birikimli dağılım fonksiyonu (yoğunluk fonksiyonunda kullanılan ayn terimlerle) şöyle ifade edilir:

{\begin{aligned}\Phi _{\mu ,\sigma ^{2}}(x)&{}=\int _{-\infty }^{x}\varphi _{\mu ,\sigma ^{2}}(u)\,du\\&{}={\frac {1}{\sigma {\sqrt {2\pi }}}}\int _{-\infty }^{x}\exp {\Bigl (}-{\frac {(u-\mu )^{2}}{2\sigma ^{2}}}\ {\Bigr )}\,du\\&{}=\Phi {\Bigl (}{\frac {x-\mu }{\sigma }}{\Bigr )},\quad x\in \mathbb {R} ,\end{aligned}}

Burada, parametreleri μ = 0 ve σ = 1 olan standart normal dağılımı için birikimli dağılım fonksiyonu, Φ ile ifade edilmiştir ve bu fonksiyon şudur:

\Phi (x)=\Phi _{0,1}(x)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x}\exp {\Bigl (}-{\frac {u^{2}}{2}}{\Bigr )}\,du,\quad x\in \mathbb {R} .

Standart normal birikimli dağılım fonksiyonu aynı zamanda hata fonksiyonu adı verilen bir özel fonksiyon ifade edilebilir. Hata fonksiyonu şöyle ifade edilir:

\Phi (x)={\frac {1}{2}}{\Bigl [}1+\operatorname {erf} {\Bigl (}{\frac {x}{\sqrt {2}}}{\Bigr )}{\Bigr ]},\quad x\in \mathbb {R} ,

Böylece hata fonksiyonu terimleri ile standart normal dağılımı için birikimli dağılım fonksiyonu şöyle yazılır:

\Phi _{\mu ,\sigma ^{2}}(x)={\frac {1}{2}}{\Bigl [}1+\operatorname {erf} {\Bigl (}{\frac {x-\mu }{\sigma {\sqrt {2}}}}{\Bigr )}{\Bigr ]},\quad x\in \mathbb {R} .

Standart normal dağılım için birikimli dağılım fonksiyonunun tamlayıcı fonksiyonu (yani $Q(x)=1-\Phi (x)$ ), çok kere Q-fonksiyonu olarak isimlendirilir ve özellikle bu kavram mühendislik kitaplarında büyük önemle yer almaktadır.

Standart normal birikimli dağılım fonksiyonunun tersine kuantil fonksiyonu adı verilir. Bunun formülünü ifade için önce şu ters hata fonksiyonu bulunur:

\Phi ^{-1}(p)={\sqrt {2}}\;\operatorname {erf} ^{-1}(2p-1),\quad p\in (0,1),

ve bu fonksiyon kullanılarak şu ters birikimli dağılım fonksiyonu ortaya çıkartılır:

\Phi _{\mu ,\sigma ^{2}}^{-1}(p)=\mu +\sigma \Phi ^{-1}(p)=\mu +\sigma {\sqrt {2}}\;\operatorname {erf} ^{-1}(2p-1),\quad p\in (0,1).

Bu kuantil fonksiyonuna bazen probit fonksiyonu adı da verilir. Bir probit fonksiyonu için bir elemanter basit entegralbulunamayacağı matematiksel olarak ispat edilmiştir. Normal dağılım için çok iyi sonuçlar verdiği anlaşılan yaklaşık fonksiyonlar ve yöntemler ortaya çıkarılmıştır. Bunlar arasında sayısal entegrasyon, Taylor serileri, asimtotik seriler vedevam eden kesirler yöntemlerinin kullanılması anılabilir.

Birikimli dağılım fonksiyonu için kesin alt ve üst sınırlar

Büyük değerde bir x sayısı için standart normal dağılım birikimli dağılım fonksiyonun $\scriptstyle \Phi (x)$ değerinin bire,1, yakınsalandığı ve $\scriptstyle \Phi (-x)\,{=}\,1\,{-}\,\Phi (x)$ ın ise sıfıra,0, yakınsaladığı aşikardır. Yoğunluk $\scriptstyle \varphi$ terimleri kullanılarak, şu basit üst sınır

{\frac {x}{1+x^{2}}}\varphi (x)<1-\Phi (x)<{\frac {\varphi (x)}{x}},\qquad x>0,

ifadesi yeterlidir.

Yerine koymak suretiyle entegresyon yöntemi kullanarak, üst sınır şöyle ortaya çıkartılabilir:

{\begin{aligned}1-\Phi (x)&=\int _{x}^{\infty }\varphi (u)\,du\\&<\int _{x}^{\infty }{\frac {u}{x}}\varphi (u)\,du=\int _{x^{2}/2}^{\infty }{\frac {e^{-v}}{x{\sqrt {2\pi }}}}\,dv=-{\biggl .}{\frac {e^{-v}}{x{\sqrt {2\pi }}}}{\biggr |}_{x^{2}/2}^{\infty }={\frac {\varphi (x)}{x}}.\end{aligned}}

Aynı şekilde $\scriptstyle \varphi '(u)\,{=}\,-u\,\varphi (u)$ ifadesini ve bölüm kuralını kullanarak

{\begin{aligned}{\Bigl (}1+{\frac {1}{x^{2}}}{\Bigr )}(1-\Phi (x))&=\int _{x}^{\infty }{\Bigl (}1+{\frac {1}{x^{2}}}{\Bigr )}\varphi (u)\,du\\&>\int _{x}^{\infty }{\Bigl (}1+{\frac {1}{u^{2}}}{\Bigr )}\varphi (u)\,du=-{\biggl .}{\frac {\varphi (u)}{u}}{\biggr |}_{x}^{\infty }={\frac {\varphi (x)}{x}}.\end{aligned}}

ifadesi ortaya çıkartılır. Bunun $\scriptstyle 1\,{-}\,\Phi (x)\,$ terimleri ile çözümlenmesi yukarıda ifade edilen üst sınırı verir.

Üreten fonksiyonlar

Moment üreten fonksiyon

Genel olarak moment üreten fonksiyon, exp(tX) için beklenen değer olarak tanımlanır. Bir normal dağılım için moment üreten fonksiyonu şu olur:

{\begin{aligned}M_{X}(t)&{}=\mathrm {E} \left[\exp {(tX)}\right]\\&{}=\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp {\left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)}\exp {(tx)}\,dx\\&{}=\exp {\left(\mu t+{\frac {\sigma ^{2}t^{2}}{2}}\right)}\end{aligned}}

Bu ifade, tanımda verilen üssel değerin, karesini tamamlamak yöntemi dönüştürülmesi ile elde edilmiştir.

Kümülant üreten fonksiyon

Kümülant üreten fonksiyon, moment üreten fonksiyonun logaritmasidir:

g(t) = μt + σ²t²/2.

Bu t terimleri ile bir kuadratik polinom olduğu için yalnız ilk iki kümülant için sıfır olmayan değer bulunabilinir.

Karakteristik fonksiyon

Karakteristik fonksiyon, $i$ sanal birim ile gösterilen $\exp(itX)$ ifadesinin beklenen değersi olarak tanımlanmıştır. Bu nedenle karakteristik fonksiyon, moment üreten fonksiyon içindeki $t$ teriminin $it$ ile değiştirilmesi ile elde edilir.

Bir normal dağılımı için karakteristik fonksiyonu şudur:

{\begin{aligned}\chi _{X}(t;\mu ,\sigma )&{}=M_{X}(it)=\mathrm {E} \left[\exp(itX)\right]\\&{}=\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\exp(itx)\,dx\\&{}=\exp \left(i\mu t-{\frac {\sigma ^{2}t^{2}}{2}}\right).\end{aligned}}

Özellikleri

Normal dağılımın şu özellikleri vardır:

Eğer $X\sim N(\mu ,\sigma ^{2})$ ve $a$ ile $b$ reel sayılar ise, o zaman $aX+b\sim N(a\mu +b,(a\sigma )^{2})$ (Beklenen değer ve varyans maddelerine bakınız.).
Eğer $X\sim N(\mu _{X},\sigma _{X}^{2})$ ve $Y\sim N(\mu _{Y},\sigma _{Y}^{2})$ ifadeleri bağımsız normal rassal değişkenler ise, o halde -
- Bunların toplamı $U=X+Y\sim N(\mu _{X}+\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})$ normal dağılım gösterir (proof). Daha ilgi çekici olarak bunun tersi de geçerlidir: Eğer iki bağımsız rassal değişkenlerin toplamı normal dağılım gösteriyorsa, her iki değişken de ayrı ayrı normal dağılım gösterirler. Bu Cramer'in teoremi olarak isimlendirilmiştir.
- Bunların arasındaki fark şu şekilde normal dağılım gösterir: Yani $V=X-Y\sim N(\mu _{X}-\mu _{Y},\sigma _{X}^{2}+\sigma _{Y}^{2})$ .
- Eğer X ve Y rassal değişkenlerinin varyansları birbirine eşitse, U (toplam için rassal değişken) ve V (fark için rassal değişken) birbirinden bağımsızdırlar.
- Kullback-Leibler ayrımı şöyle ifade edilir
  $D_{\rm {KL}}(X\|Y)={1 \over 2}\left(\log \left({\sigma _{Y}^{2} \over \sigma _{X}^{2}}\right)+{\frac {\sigma _{X}^{2}}{\sigma _{Y}^{2}}}+{\frac {\left(\mu _{Y}-\mu _{X}\right)^{2}}{\sigma _{Y}^{2}}}-1\right).$
Eğer $X\sim N(0,\sigma _{X}^{2})$ ve $Y\sim N(0,\sigma _{Y}^{2})$ birbirinden bağımsız normal rassal değişkenler ise; o zaman
- Bunların çarpımı, yani $XY$ , $p$ ile şöyle ifade edilen yoğunluk fonksiyonu olan özel bir dağılım gösterir
  $p(z)={\frac {1}{\pi \,\sigma _{X}\,\sigma _{Y}}}\;K_{0}\left({\frac {|z|}{\sigma _{X}\,\sigma _{Y}}}\right),$ burada $K_{0}$ birdeğiştirilmiş ikinci derecede Bessel fonksiyonudur.
- Bunların birbirine oranı $X/Y\sim \mathrm {Cauchy} (0,\sigma _{X}/\sigma _{Y})$ şekilde Cauchy dağılımı gösterir. Böylece bu Cauchy dağılımı özel bir tip orantı dağılımı olur.
Eğer $X_{1},\dots ,X_{n}$ bir seri bağımsız standart normal değişkenler ise, o zaman bunların toplamı, yani $X_{1}^{2}+\cdots +X_{n}^{2}$ n serbestlik dereceli bir ki-kare dağılımı gösterir.

Normal rassal değişkenlerin standart forma dönüşümleri

Yukarıda verilen 1. özellik sonucu olarak tüm normal rassal değişkenleri standart normale dönüştürmek imkânı vardır: Eğer $X$ ~ $N(\mu ,\sigma ^{2})$ ise, bu halde

Z={\frac {X-\mu }{\sigma }}\!

bir standart normal rassal değişken olur; yani $Z$ ~ $N(0,1)$ .

Bunun bir önemli sonucu birikimli olasılık fonksiyonun bir genel normal dağılımı olmasıdır:

\Pr(X\leq x)=\Phi \left({\frac {x-\mu }{\sigma }}\right)={\frac {1}{2}}\left(1+\operatorname {erf} \left({\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\right).

Tersini ele alırsak, eğer $Z$ bir standart normal dağılım ise, yani $Z$ ~ $N(0,1)$ ise o halde

X=\sigma Z+\mu

ifadesi de beklenen değeri $\mu$ ve varyansı $\sigma ^{2}$ olan bir normal rassal değişkendir.

Standart normal dağılım için çeşitli tablolar bulunmaktadır. Çok kere bu tablolar birikimli dağılım fonksiyonu, Φ şeklindedirler. Diğer normal dağılımlar basit bir dönüşüm ile standart normal dağılıma dönüştürülüp bu tablolardan biri kullanılabilir.

Momentler

Normal dağılım için ilk birkaç momentleri şunlardır:

Sayı	Ham moment	Merkezsel moment	Kümülant
0	1	1
1	$\mu$	0	$\mu$
2	$\mu ^{2}+\sigma ^{2}$	$\sigma ^{2}$	$\sigma ^{2}$
3	$\mu ^{3}+3\mu \sigma ^{2}$	0	0
4	$\mu ^{4}+6\mu ^{2}\sigma ^{2}+3\sigma ^{4}$	$3\sigma ^{4}$	0
5	$\mu ^{5}+10\mu ^{3}\sigma ^{2}+15\mu \sigma ^{4}$	0	0
6	$\mu ^{6}+15\mu ^{4}\sigma ^{2}+45\mu ^{2}\sigma ^{4}+15\sigma ^{6}$	$15\sigma ^{6}$	0
7	$\mu ^{7}+21\mu ^{5}\sigma ^{2}+105\mu ^{3}\sigma ^{4}+105\mu \sigma ^{6}$	0	0
8	$\mu ^{8}+28\mu ^{6}\sigma ^{2}+210\mu ^{4}\sigma ^{4}+420\mu ^{2}\sigma ^{6}+105\sigma ^{8}$	$105\sigma ^{8}$	0

Normal dağılım için ilk iki kümülant dışındaki kümülant değerler hep sıfıra eşittir.

Daha büyük sayıya bağlı ( $2k$ derecede ve $\mu =0$ ) merkezsel momenti şu formül kullanılarak elde edilebilir:

$E\left[x^{2k}\right]={\frac {(2k)!}{2^{k}k!}}\sigma ^{2k}.$

Normal rassal değişirler için üretici değerler

Bilgisayarla simulasyon yapılmakta iken, çok kere bir normal dağılım için değerlerin üretilmesi gerekir. Bunun için birkaç değişik yöntem kullanılabilir. En basit şekilde bir standart normal dağılım birikimli olasılık fonksiyonunun tersini almak suretiyle elde edilir. Daha etkin yöntemler de geliştirilmiştir.

Çok popüler olarak kullanılan yöntem Box-Muller dönüşümüdür. Box-Muller algoritması kullanılması, [0,1] arasında bulunan sürekli tekdüze dağılım gösteren iki sayı a ve b ile başlar; bunlardan şu formüllere göre iki standart normal dağılım gösteren c ve d sayıları şöyle elde edilir:

c={\sqrt {-2\ln a}}\cdot \cos(2\pi b)

d={\sqrt {-2\ln a}}\cdot \sin(2\pi b)

Bunların elde edilmesi, dönüşümün bazında (yukarıda 4. özellikte gösterilen) 2 serbestlik derecesi olan bir ki-kare dağılımının kolayca üretilebilinen bir üstel rassal değişken olması gerçeğine dayandırılır.

Halen en etkin şekilde normal dağılımı simulasyonu için, ziggurat algoritması kullanılmaktadır.

Merkezi limit teoremi

n=48 ve p=1/4 parametreleri olan bir binom dağılımının olasılık kütle fonksiyonun yaklaşımı olarak μ = 12 ve σ = 3 parametreli bir normal dağılımın olasılık yoğunluk fonksiyonunun gösterinimi.

Sonlu varyansları olan bağımsız ve aynı dağılımlı rassal değişkenler ve benzeri koşullar altında, büyük sayıda rassal değişkenlerin toplamı yaklaşık olarak normal dağılım gösterir. Bu merkezsel limit teoremidir.

Merkezsel limit teoreminin pratik önemi normal birikimli dağılım fonksiyonunun bazı diğer birikimli dağılım fonksiyonunun yaklaşık olarak kullanabilmesindedir. Örneğin

Parametreleri n ve p olan bir binom dağılım için, eğer büyük değerlerde, ama 0 veya 1e çok yakın olmayan n vep bulunursa bir normal dağılımına yaklaşmış oldukları kabul edilebilir. (Bazı istatistik kitapları bu yaklaşımın np ve n(1 -p değerlerinin her ikisi için en aşağı 5 olması halinde uygulanmasını ve eğer 5 olurlarsa bir devamlılık doğrulaması kullanılmasını tavsiye ederler.)
Eğer yaklaşık olarak normal dağılımı kullanılırsa bunun parametreleri μ = np ve σ² = np(1-p) olarak bulunması gerekir.
Eğer λ'nin değeri büyük ise, λ parametreli Poisson dağılımı için yaklaşık olarak normal dağılım kullanılabilir ve bu halde yaklaşık normal dağılımın parametreleri μ = σ² = λ olarak bulunur.

Bu yaklaşımların yeter derecede doğru olup olmayacağı, sonuçların ne maksatlarla kullanacaklarına ve normal dağılımın yakınsalama oranına bağlıdır. Bu tip yaklaşımlar dağılımın kuyruk değerlerine yaklaştıkça gittikçe daha çok hatalı olacaklardır. Berry-Essen teoremi birikimli dağılım fonksiyonu için yaklaşım hatası için genel üst sınırları gösterir.

Sonsuz olarak bölünebilme

Normal dağılımlar sonsuz olarak bölünebilen olasılık dağılımlarıdır: Bir ortalama değeri μ, bir varyans değeri σ²≥ 0 ve bir doğal sayı değeri n verildiği zaman, n bağımsız rassal değişkenlerin toplamı olan 'X₁ + . . . +X_n' şu normal dağılımı gösterir:

X_{1},X_{2},\dots ,X_{n}\sim N(\mu /n,\sigma ^{2}\!/n)\,

ç

(Daha fazla ayrıntı için matematik tümevarım ile normal dağılım gösteren rassal değişkenlerin toplamı maddelerine bakınız.)

Dengelilik

Normal dağılımlar kesinlikle dengelilik gösteren olasılık dağılımlarıdır.

Standart sapma ve güven aralıkları (açıklıkları)

Koyu mavi ortalamadan bir standart sapma daha küçüktür. Bir normal dağılım için bu (koyu mavi) eğrinin altında kalan alan, toplam alanın %68'ini kapsar. Ortalamadan iki standart sapma aralığında noktalar için eğrinin altında kalan alan (açık, orta ve koyu mavi alan) toplam alanın %99,7sini kapsar.

Bir normal dağılımdan seçilmiş değerlerin %68i ortalama olan μ'in bir standart sapma σ > 0 uzaklığındaki noktalar arasındadır; değerlerin neredeyse %95i μ'den iki standart sapma uzaklıklar aralığında; ve %99,7 üç standart sapma uzaklıklar aralığında bulunur. Buna empirik kural veya 68-95-99.7 kuralı adı da verilir.

Daha doğru bir kesin ifadeyle μ - nσ ve μ + nσ arasındaki çan eğrisinin altında kalan alanın birikimli normal dağılım fonksiyonu şöyle verilir:

{\begin{aligned}&\Phi _{\mu ,\sigma ^{2}}(\mu +n\sigma )-\Phi _{\mu ,\sigma ^{2}}(\mu -n\sigma )\\&=\Phi (n)-\Phi (-n)=2\Phi (n)-1=\mathrm {erf} {\bigl (}n/{\sqrt {2}}\,{\bigr )},\end{aligned}}

Burada erf hata fonsiyonudur. Ondalık sayılarla 12 basamak kullanılarak 1-, 2- .. 6- sigma noktalarına kadar değerler şöyle verilir:

$n\,$	$\mathrm {erf} {\bigl (}n/{\sqrt {2}}\,{\bigr )}\,$
1	0.682689492137
2	0.954499736104
3	0.997300203937
4	0.999936657516
5	0.999999426697
6	0.999999998027

İkinci tablo çan eğrisinin altındaki alan için değerlerin bulunmasını sağlamak üzere, çok zaman kullanılan katsayı değerlerindeki, sigma çarpanlarının ters ilişkisini gösterir. Normal dağılım gösteren veya asimtotda normal olan kestirimler için belirtilmiş olan seviyelerde (asimtotik) güvenlik aralığını saptamak için bu değerler çok kullanışlıdır:

$\mathrm {erf} {\bigl (}n/{\sqrt {2}}\,{\bigr )}$	$n\,$
0.80	1.28155
0.90	1.64485
0.95	1.95996
0.98	2.32635
0.99	2.57583
0.995	2.80703
0.998	3.09023
0.999	3.29052

Bu tabloda sol taraftaki sütun bilinen bir aralığa düşecek değerlerin oranı verilmekte ve soldaki n sütunu ise aralığın genişliğinin kaç tane standart sapma birimini ihtiva ettiğini göstermektedir.

Üstel ailesi şekli

Normal dağılım bir iki parametreli üstel ailesi elemanıdır. İki tane doğal parametresi μ ve 1/σ² olur ve doğal istatistikleri X ve X² dir. Kanonik şeklinin parametreleri ${\mu \over \sigma ^{2}}$ ve ${1 \over \sigma ^{2}}$ olup yeterli istatistikleri $\sum x$ ve $-{1 \over 2}\sum x^{2}$ olur.

İlişkili dağılımlar

Eğer $R={\sqrt {X^{2}+Y^{2}}}$ ise ve burada $X\sim N(0,\sigma ^{2})$ ave $Y\sim N(0,\sigma ^{2})$ iki bağımsız normal dağılımlarsa, o halde $R\sim \mathrm {Rayleigh} (\sigma ^{2})$ bir Rayleigh dağılımı olur.
Eğer $Y=\sum _{k=1}^{\nu }X_{k}^{2}$ ise ve burada $k=1,\dots ,\nu$ için $X_{k}\sim N(0,1)$ ise ve bunların hepsi bağımsızlarsa; o zaman $Y\sim \chi _{\nu }^{2}$ serbestlik derecesi $\nu$ olan bir ki-kare dağılımıolur.
Eğer iki bağımsız normal dağılımlı $X_{1}\sim N(0,1)$ ve $X_{2}\sim N(0,1)$

için $Y=X_{1}/X_{2}$ ise, o zaman $Y\sim \mathrm {Cauchy} (\mu =0,\theta =1)$ bir Cauchy dağılımıdır.

Eğer $Y=e^{X}$ ve $X\sim N(\mu ,\sigma ^{2})$ ise, o zaman $Y\sim {\mbox{Log-N}}(\mu ,\sigma ^{2})$ birlog-normal dağılımıdır.
Lévy çarpık alpha-durağan dağılımına ilişki: Eğer $X\sim {\textrm {Levy-S}}\alpha {\textrm {S}}(2,\beta ,\sigma /{\sqrt {2}},\mu )$ ise o halde $X\sim N(\mu ,\sigma ^{2})$ .
Kesilmiş normal dağılımı. Eğer $X\sim N(\mu ,\sigma ^{2}),\!$ o halde Xi alttan $A$ 'da ve üstten $B$ 'de kesmek suretiyle, ortalaması $E(X)=\mu +{\frac {\sigma (\varphi _{1}-\varphi _{2})}{T}},\!$ olan bir rassal değişken ortaya çıkarılır.

Burada $T=\Phi \left({\frac {B-\mu }{\sigma }}\right)-\Phi \left({\frac {A-\mu }{\sigma }}\right),\;\varphi _{1}=\varphi \left({\frac {A-\mu }{\sigma }}\right),\;\varphi _{2}=\varphi \left({\frac {B-\mu }{\sigma }}\right)$ olur ve $\varphi$ bir standart normal rassal değişken için bir olasılık yoğunluk fonksiyonu olur.

Eğer $X$ normal dağılım gösteren bir rassal değişken ise ve $Y=|X|$ ise, o halde $Y$ bir katlanmış normal dağılım gösterir.

Betimsel ve çıkarımsal istatistikler

Puanlar

Puan verme çeşitlerinin çoğu normal dağılıma bağlı olarak ortaya çıkarılmıştır. Değişik puanlama yöntemleri arasında yüzbirliklerle sıralamalar, normal eğri eşitliklikleri, staninler, z puanı ve T-puanlaması vb. sayılabilir. Davranışsal bilimlerde kullanılan birçok istatistiksel yordamlar puanların normal dağılım gösterdiği varsayımına dayanılarak geliştirilmiştir. Örneğin çok kişiye uygulanan imtihan veya zeka testleri için bir çan eğrisine dayanan not verilip imtihan veya test sonuçlarının gruplanması veya sıralanması imtihan veya test notlarının normal dağılım gösterdiği varsayımına dayandırılır.

Normallik sınamaları

Normallik sınamaları, verilmiş bir veri dizisinin normal dağılıma benzerliğinin incelenmesidir. Bu sınamalarda sıfır hipoztez veri dizisinin normal dağılıma benzer olmasıdır. Bu nedenle normal olmayan veri için yeter derecede küçük bir p-değeri (yani genellikle %0,05'ten veya 0,01den küçük) ortaya çıkacak ve sıfır hipotez olan veri dizisinin normal dağılıma benzerliği hipotezinin ret edilmesine neden olacaktır.

Parametrelerin kestirimi

Parametrelerin maksimum olabilirlik kestirimi

Bir düşünce denemesi olarak, bir seri normal dağılım için

X_{1},\dots ,X_{n}

Gauss Eğrisi

ifadesinin her biri diğerinden bağımsız olduğu düşünülsün. Her bir ifade beklenen değersi μ ve varyansı σ²>0 olan normal dağılımlar göstermektedir. İstatistikçiler bu n rassal değişkenin gözümlenen değerlerinin normal dağılım gösteren bir anakütleden ortaya çıkan bir n büyüklüğünde bir örneklem olduğunu kabul etmektedirler. Bu örneklemden gözlenen değerlere dayanarak "anakütle ortalaması" μ ve "anakütle standart sapması" kestirimcilerini bulmak arzu edilmektedir. Bu n sayıdaki bağımsız rassal değişken için sürekli ortak olasılık yoğunluk fonksiyonu şöyle verilir:

{\begin{aligned}f(x_{1},\dots ,x_{n};\mu ,\sigma )&=\prod _{i=1}^{n}\varphi _{\mu ,\sigma ^{2}}(x_{i})\\&={\frac {1}{(\sigma {\sqrt {2\pi }})^{n}}}\prod _{i=1}^{n}\exp {\biggl (}-{1 \over 2}{\Bigl (}{x_{i}-\mu  \over \sigma }{\Bigr )}^{2}{\biggr )},\quad (x_{1},\ldots ,x_{n})\in \mathbb {R} ^{n}.\end{aligned}}

μ ve σ fonksiyonları olarak, X₁, ..., X_n gözlemlerine dayanan olabilirlik fonksiyonu şudur:

L(\mu ,\sigma )={\frac {C}{\sigma ^{n}}}\exp \left(-{\sum _{i=1}^{n}(X_{i}-\mu )^{2} \over 2\sigma ^{2}}\right),\quad \mu \in \mathbb {R} ,\ \sigma >0,

Burada C>0 herhangi bir sabittir. Bunun genellikle X₁,...,X_n değişkenlerine bile dayanarak bağlandığı kabul edilmektedir; ama hesaplanan parametrelere göre log-olabilirlik fonksiyonların kısmî türevleri bulunduğu zaman sabit oldukları için elimine edilmektedirler.

Maksimum olabilirlik yöntemine göre olabilirlik fonksiyonu maksimize eden μ ve σ değerleri, teorik anakütle parametreleri olan μ ve σ için kestirim oldukları kabul edilmektedir. Genel olarak iki değişkenli bir fonksiyonun maksimum değerini hesaplanmaktayken kısmî türevler kullanılır. Ancak burada maksimum hesaplama daha kolaylaşmaktadır çünkü olabilirlik fonksiyonunu maksimize eden μ değeri bulunmakta iken σ anakütle parametresi olan σya bağımlı olmayan bir sabittir. Bundan dolayı ilk olarakμ değeri bulunur; bu değer olabilirlik fonksiyonundaki μ değişkeni yerine konulur ve bu yeni tek değişkenli fonksiyonu maksimize eden σ değeri bulunur.

olabilirlik fonksiyonunun şu toplam ifadesinin bir azalan fonksiyonu olduğu bilinmektedir:

\sum _{i=1}^{n}(X_{i}-\mu )^{2}.\,\!

Bu toplam ifadeyi minimize edecek μ değerini bulmak istenmektedir. Şu ifade

{\overline {X}}_{n}=(X_{1}+\cdots +X_{n})/n

n gözleme dayanan bir "örneklem ortalamasıdır. Böylece

{\begin{aligned}\sum _{i=1}^{n}(X_{i}-\mu )^{2}&=\sum _{i=1}^{n}{\bigl (}(X_{i}-{\overline {X}}_{n})+({\overline {X}}_{n}-\mu ){\bigr )}^{2}\\&=\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}+2({\overline {X}}_{n}-\mu )\underbrace {\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})} _{=\,0}+\sum _{i=1}^{n}({\overline {X}}_{n}-\mu )^{2}\\&=\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}+n({\overline {X}}_{n}-\mu )^{2}.\end{aligned}}

Bu ifadede so terim μ değişkenine bağlıdır ve bu terimin minimum değeri şöyle bulunur:

{\widehat {\mu }}_{n}={\overline {X}}_{n}.

İşte bu ifade n sayıda X₁,....,X_n gözlem kullanarak μnun maksimum olabilirlik kestirimidir. Sonuç olarak

L({\overline {X}}_{n},\sigma )={\frac {C}{\sigma ^{n}}}\exp {\biggl (}-{\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2} \over 2\sigma ^{2}}{\biggr )},\quad \sigma >0.

elde edilir. olabilirlik fonksiyonunun logaritmasi olan log-olabilirlik fonksiyonu matematik notasyona göre küçük harflerle (yani $\ell$ , yazılması alışılagelmiştir.

\ell ({\overline {X}}_{n},\sigma )=\log C-n\log \sigma -{\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2} \over 2\sigma ^{2}},\quad \sigma >0,

Sonra

{\begin{aligned}{\partial  \over \partial \sigma }\ell ({\overline {X}}_{n},\sigma )&=-{n \over \sigma }+{\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2} \over \sigma ^{3}}\\&=-{n \over \sigma ^{3}}{\biggl (}\sigma ^{2}-{1 \over n}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2}{\biggr )},\quad \sigma >0.\end{aligned}}

olur. Bu türev, σ² değeri 0 ile

{\hat {\sigma }}_{n}^{2}:={1 \over n}\sum _{i=1}^{n}(X_{i}-{\overline {X}}_{n})^{2},

değeri arasında ise pozitif olur; bu değere eşitse türev sıfıra eşittir; bu değerden büyükse türev negatif olur.

Bu analizin sonucu olarak bu bulunan artıklar n gözlemli örneklem için σ² bir maksimum olabilirlik kestirimidir ve bunun kare kökü σ için maksimum olabilirlik kestirimdir. Bu kestirim yani ${\hat {\sigma }}{}_{n}^{2}$ bir yanlı kestirimdir. Alışılagelen yansız kestirim n/(n - 1) çarpı bu kestirimdir. Ancak yanlı maksimum olabilirlik kestirimi için ortalama hata karesi yansız kestirimden daha küçüktür.

Parametrelerin yansız kestirimi

Bir örneklemden elde edilen anakütle ortalamasının maksimum olabilirlik kestirimcisi, anakütle ortalamasının yansız kestirimcisiolarak bilinir. Aynı şekilde anakütle ortalaması önsel olarak bilinirse, varyans için maksimum olabilirlik kestrimcisi de yansız kestirimcidir. Ancak eğer elimizde bir örneklem bulunuyorsa ama bu örneklemin geldiği anakütlenin ne ortalamasının ne de varyansının değerlerin bilmiyorsak, anakütle varyansının yansız kestrimicisi, $\sigma ^{2}$ , şöyle ifade edilir:

S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}.

Eğer tüm X_i birbirinden bağımsız ve aynı şekilde dağılım gösterirlerse, bu "örneklem varyansı" bir Gamma dağılımıgösterir:

S^{2}\sim \operatorname {Gamma} \left({\frac {n-1}{2}},{\frac {2\sigma ^{2}}{n-1}}\right).

Ayrıca bakınız

Standart normal dağılım
Veri dönüşümleri (istatistik) - Verileri normal dağılıma dönüştürmek için basit teknikler
Erdős-Kac teoremi, Sayı teorisi içinde normal dağılımın meydana çıkışı.
- Iannis Xenakis, Müzik için Gauss-tipi dağılımı.
Ters Gauss-tipi dağılım
Log-normal dağılım
Çokdeğişirli normal dağılım
Matris normal dağılımı
Normal dağılım gösterme ve korelasyon olmaması bağımsızlık ifade etmez.(İki tane birbirinden bağımsız olmadan birbirleri ile korelasyon göstermeyen normal dağılımlı rassal değişken için örnek verilmiştir. Bu örnek çokludeğişirli normal dağılım için geçerli değildir.)
Student'in t dağılımı

Kaynakça

^ H. Gavil, 2003

Dış bağlantılar

Olasılık yoğunluk fonksiyonu Standard normal dağılım yeşil çizgi ile gösterilir
Yığmalı dağılım fonksiyonu Renkler yukarıdaki gösterim ile aynıdır
Parametreler	$\mu$ konum (reel) $\sigma ^{2}>0$ kare ölçek (reel)
Destek	$x\in \mathbb {R} \!$
Olasılık yoğunluk fonksiyonu (OYF)	${\frac {1}{\sigma {\sqrt {2\pi }}}}\;\exp \left(-{\frac {\left(x-\mu \right)^{2}}{2\sigma ^{2}}}\right)\!$
Birikimli dağılım fonksiyonu (YDF)	${\frac {1}{2}}\left(1+\mathrm {erf} \,{\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)\!$
Ortalama	$\mu$
Medyan	$\mu$
Mod	$\mu$
Varyans	$\sigma ^{2}$
Çarpıklık	0
Fazladan basıklık	0
Entropi	$\ln \left(\sigma {\sqrt {2\,\pi \,e}}\right)\!$
Moment üreten fonksiyon (mf)	$M_{X}(t)=\exp \left(\mu \,t+{\frac {\sigma ^{2}t^{2}}{2}}\right)$
Karakteristik fonksiyon	$\chi _{X}(t)=\exp \left(\mu \,i\,t-{\frac {\sigma ^{2}t^{2}}{2}}\right)$

Normal dağılım

Tarihçe

Karakteristikler

Olasılık yoğunluk fonksiyonu

Birikimli dağılım fonksiyonu

Birikimli dağılım fonksiyonu için kesin alt ve üst sınırlar

Üreten fonksiyonlar

Moment üreten fonksiyon

Kümülant üreten fonksiyon

Karakteristik fonksiyon

Özellikleri

Normal rassal değişkenlerin standart forma dönüşümleri

Momentler

Normal rassal değişirler için üretici değerler

Merkezi limit teoremi

Sonsuz olarak bölünebilme

Dengelilik

Standart sapma ve güven aralıkları (açıklıkları)

Üstel ailesi şekli

İlişkili dağılımlar

Betimsel ve çıkarımsal istatistikler

Puanlar

Normallik sınamaları

Parametrelerin kestirimi

Parametrelerin maksimum olabilirlik kestirimi

Parametrelerin yansız kestirimi

Ayrıca bakınız

Kaynakça

Dış bağlantılar

Normal dağılım

Yazılım sonuçları ve uygulamaları

Algoritmalar ve yaklaşımlar