Matematiksel istatistik

matematiksel yöntemlerin kullanıldığı olası istatistikler

Matematiksel istatistik, istatistiksel veri toplama tekniklerinin aksine, matematiğin bir dalı olan olasılık teorisinin istatistiğe uygulanmasıdır. Bunun için kullanılan özel matematiksel teknikler arasında matematiksel analiz, doğrusal cebir, stokastik analiz, diferansiyel denklemler ve ölçü teorisi bulunur.[1][2]

Bir veri kümesindeki doğrusal regresyonun gösterimi. Regresyon analizi, matematiksel istatistiğin önemli bir parçasıdır.

İstatistiksel veri toplama, özellikle rastgele deneylerin tasarımı ve rastgele örnekleme kullanılan anketlerin planlanmasıyla çalışmaların planlanmasıyla ilgilidir. Verilerin ilk analizi, genellikle yürütülen çalışmadan önce belirlenen çalışma protokolünü takip eder. Bir çalışmadan elde edilen veriler, ilk sonuçlardan esinlenen ikincil hipotezleri dikkate almak veya yeni çalışmalar önermek için de analiz edilebilir. Bir planlı çalışmadan elde edilen verilerin ikincil analizi veri analizi araçları kullanılarak yapılır ve bu analiz süreci matematiksel istatistiktir.

Veri analizi ikiye ayrılır:

  • Tanımlayıcı istatistik - istatistiğin verileri tanımlayan, yani verileri ve tipik özelliklerini özetleyen kısmı.
  • Çıkarımsal istatistik - istatistiğin verilerden (veriler için bir model kullanarak) sonuç çıkaran kısmı: Örneğin, çıkarımsal istatistikler, veriler için bir model seçmeyi, verilerin belirli bir modelin koşullarını karşılayıp karşılamadığını kontrol etmeyi ve ilgili belirsizliği sayıya dökmeyi (örneğin, güven aralıklarının kullanılması) içerir.

Veri analizi araçları en iyi rastgele çalışmalardan elde edilen veriler üzerinde çalışırken, aynı zamanda diğer veri türlerine de uygulanır. Örneğin, doğal deneylerden ve gözlemsel çalışmalardan elde edilen verilere uygulanan modeller istatistikçi tarafından seçilerek uygulanır ve bu nedenle özneldir.

Aşağıda matematiksel istatistikteki önemli konulardan bazıları verilmiştir:[3][4]

Olasılık dağılımları

değiştir

Olasılık dağılımı, rastgele bir deney, araştırma veya istatistiksel çıkarım prosedürünün olası sonuçlarının tüm ölçülebilir alt kümelerine bir olasılık değeri atayan işlevdir . Örnekler, dağılımın kategorik olacağı, sayısal olmayan örnek uzayına sahip deneylerde; dağılımın bir olasılık kütle fonksiyonu ile tanımlanabildiği, ayrık rassal değişkenler tarafından kodlanan örnek uzaya sahip deneylerde ve dağılımın bir olasılık yoğunluk fonksiyonu ile tanımlanabildiği sürekli rassal değişkenler tarafından kodlanan örnek uzaya sahip deneylerde bulunur. Sürekli zamanda tanımlanan stokastik süreçleri içeren daha karmaşık deneyler, daha genel olasılık ölçülerinin kullanılmasını gerektirebilir.

Bir olasılık dağılımı tek değişkenli veya çok değişkenliolabilir. Tek değişkenli bir dağılım, çeşitli alternatif değerleri alan tek bir rastgele değişkenin olasılıklarını verir; çok değişkenli bir dağılım (bir ortak olasılık dağılımı), çeşitli değer kombinasyonlarını alan rastgele bir vektörün (iki veya daha fazla rastgele değişken kümesi) olasılıklarını verir. Tek değişkenli olasılık dağılımlarına, binom dağılımı, hipergeometrik dağılım ve normal dağılım örnek verilebilir. Çok değişkenli normal dağılım, yaygın olarak karşılaşılan çok değişkenli bir dağılım örneğidir.

Özel dağılımlar

değiştir

İstatiksel çıkarım

değiştir

İstatistiksel çıkarım, rastgele sapmaya, örneğin gözlemsel hatalara veya örnekleme varyasyonuna tabi olan verilerden sonuç çıkarma sürecidir.[5] Çıkarım ve tümevarım için böyle bir prosedür sisteminin ilk gereksinimleri, sistemin iyi tanımlanmış durumlara uygulandığında makul yanıtlar üretmesi ve bir dizi duruma uygulanacak kadar genel olmasıdır. Çıkarımsal istatistikler, hipotezleri test etmek ve örnek verileri kullanarak tahminler yapmak için kullanılır. Tanımlayıcı istatistikler bir örneklemi tanımlarken, çıkarımsal istatistikler örneklemin temsil ettiği daha büyük bir popülasyon hakkında çıkarım yapar.

İstatistiksel çıkarımın sonucu, "bundan sonra ne yapılmalı?" sorusuna cevap olabilir. İstatistiksel çıkarım çoğunlukla, rastgele örnekleme yoluyla ilgilenilen popülasyondan elde edilen verileri kullanıp popülasyon hakkında önerilerde bulunur. Daha genel olarak, rastgele bir süreç hakkındaki veriler, sınırlı bir süre boyunca gözlemlenen davranışından elde edilir. Hakkında çıkarım yapılmak istenen bir parametre veya hipotez verildiğinde, istatistiksel çıkarım en çok şunları kullanır:

  • Randomizasyon kullanıldığında bilinen verileri üretmesi beklenen rastgele sürecin istatistiksel bir modeli ve
  • rastgele sürecin belirli bir çevrimi; yani bir veri seti.

Regresyon

değiştir

İstatistikte regresyon analizi, değişkenler arasındaki ilişkileri tahmin etmek için kullanılan istatistiksel bir süreçtir. Odak noktası bir bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişki olup bir ya da daha fazla değişkeni modellemek ve analiz etmek için birden fazla yol içerir. Daha spesifik olarak, regresyon analizi, diğer bağımsız değişkenler sabit tutulurken bağımsız değişkenlerden herhangi biri değiştiğinde, bağımlı değişkendeki (veya 'ölçüt değişken') değer değişiminin anlaşılmasına yardımcı olur. Regresyon analizi çoğunlukla, bağımsız değişkenler verildiğinde bağımlı değişkenin koşullu beklentisini, yani bağımsız değişkenler sabitlendiğinde bağımlı değişkenin ortalama değerini tahmin eder. Daha az yaygın olarak odak, verilen bağımsız değişkenlerle bağımlı değişkenin koşullu dağılımının çeyreklik veya başka bir konum parametresidir . Her durumda, tahmin hedefi bağımsız değişkenlerin bir fonksiyonu olan regresyon fonksiyonudur. Regresyon analizi, bağımlı değişkenin, bir olasılık dağılımı diye tanımlanabilen regresyon fonksiyonu etrafındaki sapma miktarlarını karakterize etmekle de ilgilenir.

Regresyon analizini için birçok teknik geliştirilmiştir. Doğrusal regresyon gibi bilinen yöntemler parametriktir, çünkü regresyon fonksiyonu, verilerden (örneğin, en küçük kareler yöntemi kullanılarak) tahmin edilen sonlu sayıda bilinmeyen parametre cinsinden tanımlanır. Parametrik olmayan regresyon, regresyon fonksiyonunun, sonsuz boyutlu olabilen belirli bir fonksiyonlar setinde yer almasına izin veren teknikleri ifade eder.

Parametrik olmayan istatistikler

değiştir

Parametrik olmayan istatistikler, parametreli olasılık dağılım ailelerine dayandırmadan verilerden hesaplanan değerlerdir. Hem tanımlayıcı hem de çıkarımsal istatistikleri içerirler. Tipik parametreler ortalama, varyans ve benzeridir. Parametrik istatistiklerin aksine, parametrik olmayan istatistikler, değerlendirilen değişkenlerin olasılık dağılımları hakkında varsayımda bulunmaz.

Parametrik olmayan yöntemler, bir ile dört arası derecelendirilen film incelemeleri gibi, sıralı düzene sahip olan popülasyonları incelemek için yaygın olarak kullanılmaktadır. Parametrik olmayan yöntemlerin kullanımı, verilerin bir sıralaması mevcutken ancak tercih değerlendirirken olduğu gibi net bir sayısal yorum bulunmadığında gerekli olabilir. Ölçüm seviyeleri açısından, parametrik olmayan yöntemler "sıralı" verilerle sonuçlanır.

Parametrik olmayan yöntemler daha az varsayım yaptığından, uygulanabilirliği karşılık gelen parametrik yöntemlerden çok daha geniştir. Özellikle incelemeye konu olan soru hakkında daha az şey bilindiği durumlarda uygulanabilirler. Ayrıca,uygulanırken daha az varsayım yapılması nedeniyle parametrik olmayan yöntemler daha sağlamdır.

Parametrik olmayan yöntemlerin kullanımının bir başka gerekçesi basitliktir. Bazı durumlarda, parametrik yöntemlerin kullanımı gerekçelendirilse bile, parametrik olmayan yöntemlerin kullanımı daha kolay olabilir. Hem bu basitlik hem de daha sağlam olmaları nedeniyle, bazı istatistikçiler parametrik olmayan yöntemlerin yanlış kullanım ve yanlış anlama riskini azalttığı görüşündedir.

İstatistik, matematik ve matematiksel istatistikler

değiştir

Matematiksel istatistik, istatistik biliminin önemli bir alt kümesidir. İstatistik teorisyenleri, matematikle istatistiksel prosedürleri inceler ve geliştirir; istatistiksel araştırma genellikle matematiksel sorular gündeme getirir. İstatistik teorisi, olasılık ve karar teorisine dayanır.

Gauss, Laplace ve CS Peirce gibi matematikçiler ve istatistikçiler, olasılık dağılımları ve kayıp fonksiyonları (veya fayda fonksiyonları) ile karar teorisini kullandılar. İstatistiksel çıkarıma karar-teorik yaklaşım, Abraham Wald ve halefleri[6][7][8][9][10][11][12] tarafından yeniden canlandırıldı ve bilimsel hesaplama, analiz ve optimizasyondan kapsamlı bir şekilde yararlanılmasını sağladı; deney tasarımı için istatistikçiler cebir ve kombinatorik kullanır.

Ayrıca bakınız

değiştir

Kaynakça

değiştir
  1. ^ Handbook of stochastic analysis and applications. New York: M. Dekker. 2002. ISBN 0824706609. 
  2. ^ Theory of statistics. Corr. 2nd print. New York: Springer. 1995. ISBN 0387945466. 
  3. ^ Hogg, R. V., A. Craig, and J. W. McKean.
  4. ^ Larsen, Richard J. and Marx, Morris L. "An Introduction to Mathematical Statistics and Its Applications" (2012).
  5. ^ Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. 978-0-19-954145-4
  6. ^ Sequential analysis. New York: John Wiley and Sons. 1947. ISBN 0-471-91806-7. See Dover reprint, 2004: 0-486-43912-7 
  7. ^ Statistical Decision Functions. John Wiley and Sons, New York. 1950. 
  8. ^ Testing Statistical Hypotheses. 2nd. 1997. ISBN 0-387-94919-4. 
  9. ^ Theory of Point Estimation. 2nd. 1998. ISBN 0-387-98502-6. 
  10. ^ Mathematical Statistics: Basic and Selected Topics. Second (updated printing 2007). 1. Pearson Prentice-Hall. 2001. 
  11. ^ Asymptotic Methods in Statistical Decision Theory. Springer-Verlag. 1986. ISBN 0-387-96307-3. 
  12. ^ Statistical Decision Theory: Estimation, Testing, and Selection. Springer. 2008. 

Konuyla ilgili yayınlar

değiştir