Negatif binom dağılımı

Olasılık kuramı ve istatistik bilim dallarında negatif binom dağılım bir ayrık olasılık dağılım tipi olup Pascal dağılımı ve Polya dağılımı bu dağılımın özel halleridir.

Negatif binom
Olasılık kütle fonksiyonu
Kırmızı çizgi ortalamayı gösterir ve yeşil çizgi için yaklaşık uzunluk 2σ olur.
Yığmalı dağılım fonksiyonu
Parametreler (rerl)
(real)
Destek
Olasılık kütle fonksiyonu (OYF)
Birikimli dağılım fonksiyonu (YDF) tanzim edilmis tamam olmayan beta fonksiyonudur
Ortalama
Medyan
Mod
Varyans
Çarpıklık
Fazladan basıklık
Entropi
Moment üreten fonksiyon (mf)
Karakteristik fonksiyon

Negatif binom dağılımın tanımlanması

değiştir

Olasılık kütle fonksiyonu

değiştir

Negatif binom dağılımları iki parametre ile tam olarak tanımlanan bir dağılımlar ailesidir. Bu nedenle istatistik tanıtıcı yazınlarında değişik şekilde tanımlar ortaya atılmıştır. Popüler olarak kullanılan bir tanım açıklanacaktır: Bu tanıma göre negatif binom dairesi için iki reel-değerli parametre p, 0 < p < 1 ve r, r > 0 olur. Matematik notasyon ile negatif binom dağılım gösteren bir rassal değişken X şöyle gösterilir:

X ~ NegBin(r, p).
Bu halde olasılık kütle fonksiyonu şöyle verilir:
 

burada k = 0,1,2,... ve

  ve Γ(r) = (r - 1)! .

Sınırsal hal

değiştir

Alternatif ikinci bir tanımda ise λ ve p parametreleri şöyle tanımlanır:

 
 

ve olasılık kütle fonksiyonu şöyle verilir:

 

Burada λ ve r negatif olmayan reel parametrelerdir.

Bu tanıma göre şu eşitlik ifadesi ortaya çıkar:

 

Bu ifade ise bir Poisson dağılımı gösteren ve Poisson oranı λ olan bir Poisson dağılım için olasılık kütle fonksiyonudur. Böylece bu ikinci tanımla negatif binom dağılımının limitte Poisson dağılımına yaklaşan bir dağılım olduğu ve r parametresinin da bu yaklaşımı kontrol parametresi olduğu açıklaşır; r değeri büyüdükçe negatif binom Poissona daha çok yaklaşacaktır. Böylece negatif binom dağılımı Poisson dağılım yerine kullanılan daha sağlam bir dağılım olmaktadır. Büyük r değeri için Poisson'a yaklaşılır ve uygun değerler daha kolayca bulunur; ama büyük r değerlerinde varyanslar küçük r değerlerinden daha büyük olur.

Gamma-Poisson bileşiği

değiştir

Üçüncü değişik bir tanım ise, nagatif binom dağılımının Poisson dağılımlarının sürekli bir bileşiğinden ortaya çıktığı ve bu bileşiği temin eden Poisson oranlı dağılımın bir gamma dağılımı olması gerçeğine dayanır. O zaman formel notasyon ile negatif binom için olasılık kütle fonksiyonu şöyle olur:

   
 
 
 
 

Bu nedenle negatif binom fonksiyonu aynı zamanda gamma-Poisson bileşiği dağılım olarak da bilinmektedir.

Yığmalı dağılım fonksiyonu

değiştir

Yığmalı dağılım fonksiyonu bir tanzim edilmiş beta fonksiyonu terimleri ile şöyle verilir:

 

Ortaya çıkma

değiştir

Bir Bernoulli tipi süreçde bekleme zamanı

değiştir

r değerinin bir tam sayı olduğu özel hal için negatif binom dağılımı Paskal dağılımı olarak bilinir. Paskal dağılımı bağımsız ve aynı şekilde dağılmış bir seri Bernoulli deneyi sonucunda başarı ve belli sayıda başarısızlık sonucu doğmasi için gerekli olasılık dağılımıdır. k+r sayıda p başarı olasılıklı Bernoulli deneyi k sayıda başarısızlık ve r sayıda başarı için, en son deney sonucu başarı ise, bir negatif binom dağılımı kullanmak uygun ve yeterlidir. Diğer bir ifade ile, nagatif binom dağılımı bir Bernoulli süreci için her denemede başarı olasılığı p olan ve r tane başarı elde etmek için gerekli başarısızlık sayısının olasılığını açıklayan bir dağılımdır.

Örneğin olarak bir tekrar tekrar zar atıp en son olarak 3 defa 6 gelme denemesine bakılsın. Burada her bir zar atışı için 'başarı' (6 gelmesi) 1/6dir. 3 defa bu başarı elde edilmesi için deneme sayısı (2,3,4,5,6,...) değerde bir sonsuz seridir. Bu sayıda deneme yapma olasılığı bir (kaydırılmış) negatif-binom dağılımı gösteren rassal değişkendir. 3 tane başarı (6) gelmeden önce gereken başarısızlık sayısı ise (0, 1, 2, 3, ...) yine bir sonsuz seridir. Böylece başarısızlık sayısı da bir negatif binom dağılım gösteren bir diğer rassal değişkendir.

Eğer r=1 ise ilk başarıyı elde etmeden başarısızlıklar sayısının (yani (k+1)inci denemede başarının} olasılık dağılımı elde edilir ve bu şu geometrik dağılımdır:

 

Fazla sapmalı bir Poisson

değiştir

Yukarıda açıklanan bir tanıma göre negatif binom dağılımı Poisson dağılımına yaklaşık olduğu zamanlar Poisson dağılımı yerine kullanılabilir. Eğer veriler aralıklı, bir yukarı limit olmadan pozitif iseler ve örnek varyansı örnek ortalama değerinden büyük ise özellikle bu yaklaşım kullanışlı olmaya başlar. Bu tip verilerde eğer ornek ortalaması ve varyansı birbirine eşitse, Poisson dağılımı kullanılması uygundur. Fakat varyans değeri artıp ortalama değerini geçince, yani fazla sapma olan bir Poisson süreç ortaya çıkarsa, negatif binom yaklaşımı kullanma uygunluğu daha da önem kazanır.

Diğer dağılımlara bağlantılar

değiştir
  • Geometrik dağılım negatif binom dağılımının özel bir halidir; yani
 
  • Şu anlamda negatif binom dağılımı Poisson dağılımına yaklaşır:
 
  • Negatif binom dağılımı aralıklı faz tipli dağılımın bir özel halidir.

Özellikler

değiştir

p parametresi için örnekleme ve nokta tahmini

değiştir

p parametresi bilinmediği farzedilsin ve bir deneme yapıp bu denemeyi uygulamaya başlamadan örnek almanın ta r sayıda başarı elde edilmesine kadar devam edileceğine karar verilmiş olsun. Bu deney için yeterli istatistik k başarısızlık sayısı olur. Bu deneyle p tahmin yapmak için en küçük varyans ortaya çıkaracak yansız nokta kestirim

 

olur. Bazı kişiler sağduyu ile

 

ifadesini uygun bir kestirim olarak ortaya atmışlardır; ancak bunu yanlı bir kestirim olduğu ispat edilmiştir.[1]

Örnekler

değiştir

Bir sokak satıcısı 30 tane daire bulunan bir küçük sokağa gelmiştir. Bu sokakta 5 tane kavun satıncaya kadar sırayla her bir dairenin kapısını çalmaya karar vermiştir. Her bir dairede tek bir kavun satışı için olasılığın %40 olduğunu ve tek kavun için satış yapmama olasılığının %60 olduğunu hayat deneyiminden bilmektedir.

Çok iyi düşünür ama pek iş bulamamış bir üniversite matematik mezunu kavun satıcısının şu soru aklını çeler:

"Son beşinci kavunu ninci daireye satmak için 'olasılık kütle fonksiyonu' ne olmalıdır?"

İleri istatistik bilgisine göre k + r sayıda Bernoulli denemesinde son denemede başarı kazanması için k sayıda başarısızlık ve r sayıda başarı kazanmanın olasılığı bir negatif binom dağılımı olan NegBin(r, p) ile bulunur. 5 tane kavun satma 5 tane başarı kazanma olmakta ve bunu başarmak için kapısını çalmasi gereken daire sayısı k+5=n olmalıdır. İlgilendiği rassal değişken daire sayısıdır; bu nedenle k=n - 5 değerini bir NegBin(5,0.40) kütle fonksiyonuna koyması gerekir. Dairelerin dağılımı için, yani (n > 5) için, şu kütle fonksiyonu elde edilir:

 

Şimdi iyi matematik bilen kavuncu olasılık sorularını cevap verecek hale gelmiştir ve birkaç soruya kafasını yorar:

1. 10uncu dairenin kapısını çaldiktan sonra 5 kavun satma hedefine erişme olasılığı nedir?

 

2. 8inci dairenin kapısını çalmadan veya kapısını çaldıktan hemen sonra hedefine erişme olasılığı ne olur?

8inci dairede ve daha önce hedefine varmayı bulmak için, 5inci, 6inci, 7inci veya 8inci dairede hedefe varma olasılıkların bulunması ve birbirine toplanması gerekir:

 
 
 
 
 

3. Matematik mezunu kavuncunun 30 daire kapısını çalıp da hedefine varamaması olasılığı nedir?

 

Kavunmu yiyenlere afiyet olsun diye düşünür matematikçi kavuncu!!

Ayrıca bakınız

değiştir

Kaynakça

değiştir