Mod

Bir veri kümesi içinde en sık görülen değer

İstatistik bilimi için mod bir veri kümesi içinde en sık görülen değerdir.[1] Tepedeğer olarak da adlandırılır. Bazı kullanım alanlarında, özellikle eğitim alanında, örnek veriler çok kere puan olarak anılmakta ve örnek mod değerine ise mod puanı adı verilmektedir.[2]

İstatiksel ortalama ve medyan gibi mod bir önemli veri bilgilerini kapsayan tek bir istatistiksel özetleme dir. Genellikle, bir veri için ortalama ve medyandan değişik değerdedir ve özellikle yüksek çarpıklık özelliği gösteren dağılımlar için bu farklılık daha da açıkça olarak görülür.

Mod mutlaka eşsiz tek olmayabilir. Bazı verilerde hiç tekrarlama olmazsa hiçbir mod bulunmaz. Diğer taraftan değişik veri değerleri ayni maksimum çokluk değerine yetişebilirler. Olasılık dağılımları için çoklu mod değerine aşırı örnekler aralıklı tekdüze dağılım ve sürekli tekdüze dağılımdır; bu dağılımlar için rassal değişkenin mümkün tüm değerleri aynı olasılıkla mod değerleridir

Mod için örnek

değiştir

Mod bir veri serisi içinde en çok tekrar edilen sayıdır.

Örneğin: 10 gözlemi kapsayan bir örneklem alınsın. Veriler şunlardır:

1,2,3,1,2,3,2,2,2,2

Bu veri serisinde tekrarlar bulunmakta ve çokluk sayımı şöyle verilebilmektedir:

 Veri değeri          1      2     3
 Frekans sayımı       2      6     2

Bu veri dizisinin modu 2dir; çünkü bu değer en çok tekrar edilmektedir.

Eğer veri dizisi içinde hiçbir tekrarlama bulunmuyorsa, veri için mod bulunmayabilir. Diğer taraftan, iki veya daha fazla veri aynı tekrarlamayı gösterebilirler; bu halde çoklu mod ortaya çıkar.

Örneğin: Büyüklüğü 15 olan bir örneklem veri dizisi şu olsun:

1,5,5,8,5,5,9,10,10,12,2,8,12,10,12,10

Bu veri dizisinin çokluk sayımı şöyle verilir:

  Veri değeri     1    2   5   8   10  12
  Frekans sayımı  1    1   4   2    4   3

Veri dizisinde en çok (4 defa) tekrarlanan sayı 5 ve 10 olduğu için veri dizisinin iki tane modu bulunmaktadır: 5 ile 10.

Eğer örneklem niceliksel değerler gösterip hacmi büyük ise veya değerleri orijini biraz olsun saklanmak istenmekte ise, örnek veri dizileri sıralanır; gruplanır ve çokluk dağılımı tablosu olarak verilir. Bu çokluk dağılım tablosundaki en büyük frekans gösteren gruba mod sınıfı adı verilir ve bu sınıfın kapsadığı değerler arasında bir sayı çokluk dağılım modu olarak bulunabilir. Bunun için formül şöyle verilebilir:

 
  • L: Mod sınıfının alt değeri
  • fs: Mod sınıfından bir sonraki sınıfın frekansı
  • fo: Mod sınıfından bir önceki sınıfın frekansı
  • c: Mod sınıfının aralığı

Bu formül ile bir çokluk dağılımından elde edilen mod değeri orijinal veri serisi içinde bulunan herhangi bir veri değerine tekabül etmeyebilir. Bu formül sadece tek modlu çokluk dağılımları için uygundur ve veri dağılımı çoklu doruk gösteriyorsa mod bulunması uygun değildir.

Hemen şunu da eklemek gerekir ki veri dizisinden elde edilen mod; bu veri dizisinin bir çeşit gruplanması ile elde edilen çokluk dağılımı mod değeri ve bu veri dizisinin diğer çeşit gruplanması ile elde edilen diğer bir çokluk dağılımının mod değerinin birbirine mutlaka eşit olmaları gerekmez; gerçekten pratikte bunların değişik olması çok büyük imkân dahilindedir. Yani aynı veri için değişik mod olması olağandır.

Olasılık dağılımı için mod

değiştir

Bir aralıklı olasılık dağılımı için mod bir rassal sayı olan xdir ve bu x değerinde olasılık kütle fonksiyonu maksimum değere varır. Diğer bir deyimle, mod rassal sayı değeri en olabilir şekilde örnek alınan değerdir.

Bir sürekli olasılık dağılımı için mod bir rassal sayı olan x olup bu sayıda olasılık yoğunluk fonksiyonu maksimum değerine varır; daha gayriresmî bir ifade ile mod olasılık yoğunluk fonksiyonu için bir doruk değeridir.

Bir olasılık kütle fonksiyonu veya olasılık yoğunluk fonksiyonu için maksimum değere birkaç noktada x1, x2, vb. bulunabilinirliğinden mod mutlaka eşsiz tek değerde değildir.

Olasılık yoğunluk fonksiyonunun çoklu olarak yöresel maksimum değerleri varsa, tüm yöresel maksimum değerlerin hepsi dağılımın mod değeri olarak anılır. Ancak yukarıdaki verilen tanımlamaya göre sadece global maksimum değer mod olup bu global maksimumdan daha küçük olan yöresel maksimum değerlerinin mod sayılmaması gerekir. Bununla beraber bu şekilde çoklu yöresel maksimum değerleri bulunan sürekli olasılık dağılımları çoklu modlu dağılım olarak anılır.

Mod, ortalama ve medyan karşılaştırılması

değiştir
 
Gelişigüzel bir olasılık dağılımı için mod, ortalama ve medyanın geometrik temsili.

Bir olasılık dağılımı için ortalama, rassal değişkenin beklenen değeri olarak adlandırılır. Diğer taraftan, eğer veri örneklemden gelmişse örneklem ortalaması adı verilir.

Tek modlu olan ve ve yansıtıcı simetri gösteren olasılık dağılımları arasında simetrik çan grafiği şeklinde olasılık yoğunluk fonksiyonu olan normal dağılım için ortalama, medyan ve mod birbirine aynıdır.

Mod kavramı isimsel ölçekli veri serileri için merkezsel konum ölçüsü olarak kullanılabilir ama bu halde anlamı biraz bulanıktır. Buna karşılık medyan ve ortalama hiç anlamsızdır.

Özellikler

değiştir

Mod için şu özellikler ilgi çeker:

  • Mod, aynı medyan ve ortalama gibi, doğrusal veya afin dönüşümden etkilenmez. Afin dönüşüm Xin yerine aX+b koymakla elde edilir.
  • Çok küçük sayıda örneklemler dışında, mod değeri örneklem aykırı değerlerinden etki görmez, yani mod güçlü ölçü olur. Medyan da bir güçlü ölçüdür.

. Ortalama ise bunların aksine eğer aykırı değerlerden çok etkilenir.

  • Karl Pearsonun ortaya attığı bir pratik kurala göre sürekli tek modlu dağılımlar için, medyan değeri, mod ve ortalama değerlerinin ortasında ortalama ve mod aralığının üçte biri noktasında bulunur. Bu formül olarak şöyle ifade edilir:
medyan ≈ (2 × ortalama + mod)/3.

Bu bir pratik kural olarak, bir normal dağılımı andıran çok az asimetri gösteren dağılımlar için doğrudur. Ancak bu kural her zaman doğru olamaz ve bu üç-zet konum istatistiğinin herhangi bir sırada olması mümkündür.[3] [4]

Çarpık bir dağılım için örnek

değiştir

Bir sınıf dağılım tipi isteğe göre çarpıklık gösterebilir. Bu log-normal dağılımıdır. Bu dağılım bir normal dağılım gösteren X rassal değişkenin logaritması alınarak bir Y rassal değişkenine (yani Y= exp (X) yaparak) dönüştürmekle elde edilir. Y rassal değişkenin logaritması normal dağılım gösterir ve bu nedenle Y dağılımına log-normal adı verilir.

Özel bir X seçilerek ortalaması μ=0 olursa, Ynin medyanı 1 olacaktır ve bu X'in standart sapması olan σdan bağımsızdır. Buna neden X normal dağılım gösterdiği için ortalama ve medyan (ve mod) ayni olmakta ve ortalama 0 olursa medyan da 0 olmaktadır. Xden Y dönüşümü u monotonik olduğu için Y için medyan değerinin 1 olduğu (exp(0)=1) açıktır.

Eğer X standart sapması σ=0,2 olursa, Y dağılımı çok çarpıklık göstermez. Ortalama ve mod değerleri sırasıyla μ=1,0202 ve mod=0,9608 olur. Bu halde medyan ortalama ile mod arasında üçte bir mesafededir.

Eğer X standart sapması çok daha büyük, (diyelim σ=5) olursa, Y dağılımı büyük ölçekte çarpıklık gösterir. Ortalama ve mod değerleri sırasıyla μ=7,3891 ve mod=0,0183 olur. Bu halde Pearson'un ortaya attığı empirik ilişki kuralı, yani medyanın ortalama ile mod arasında üçte bir mesafede olması, doğru olmaz.

Ayrıca bakınız

değiştir

Kaynakça

değiştir
  1. ^ Damodar N. Gujarati f Econometrics. McGraw-Hill Irwin. 3. basım, 2006: p. 110.probability distribution]]
  2. ^ [1] 8 Ekim 2007 tarihinde Wayback Machine sitesinde arşivlendi. Ingilizce matematik sözlüğü tanımlarından çeviri.
  3. ^ Kaynak: Paul T. von Hippel (2005) "Mean, Median, and Skew: Correcting a Textbook Rule", J. of Statistics Education C.3 :2 [2] 14 Ekim 2008 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi:15.9.2009)
  4. ^ Medyan ve diğer ortalamalar "Median". 20 Temmuz 2012 tarihinde kaynağından arşivlendi. Erişim tarihi: 4 Mart 2008.  (İngilizce)(Erişme tarihi:15.9.2009)

Dış bağlantılar

değiştir
  • [3] Mod kavramını anlamak ve hesaplamak için bir kılavuz.(İngilizce)(Erişme tarihi:20.3.2008)
  • [4]23 Temmuz 2011 tarihinde Wayback Machine sitesinde arşivlendi. Ortalama, medyan ve mod içeren bir problem. (İngilizce)(Erişme tarihi:20.3.2008)