Bu yazıda temel istatistiğin alt bileşenlerinden olan merkezi eğilim ölçüleri (aritmetik ortalama, medyan-ortanca ve tepe değer-mod) konusunu ele alacağız. Veriyi özetlemede veriyi temsil etme potansiyeli olan tek bir değer anlamı taşıyan merkezi eğilim ölçüleri ve aralarındaki farklara değineceğiz.
Hazırsanız ve kahvenizi aldıysanız başlayalım:
İçindekiler
ToggleMerkezi Eğilim Ölçüsü Nedir?
Temel Özellikleri
- Kısaca söylersek frekans dağılımları ve grafikler veri hakkında bilgilendirici olmakla beraber yeterli değildir. Verinin genel eğilimi ve yayılım (değişkenliği) hakkında ek bilgiye ihtiyaç duyulur.
- İşte bu noktada ölçüm değerlerinin hangi değer etrafında toplandıklarını belirlemek için merkezi eğilim ölçüleri kullanılır.
Aritmetik Ortalama (Mean) Nedir?
Temel Özellikleri
- Ortalama tüm kitle için hesaplanıyorsa µ, örneklemden hesaplanıyorsa x ile gösterilir.
- Gözlemlerin ortalamadan farklarının toplamı sıfırdır.
- Aynı kitleden çekilen örneklemlerin ortalamaları diğer merkezi eğilim ölçülerine kıyasla daha az değişkenlik gösterir.
- Aritmetik ortalama verideki her bir değeri kullanır. Bu değerlerden biri veya birkaçı aşırı küçük veya büyük değerli ise sorun oluşturur.
Örnek
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama izleme süresi:
Ortanca (Medyan) Nedir?
Temel Özellikleri
- Bir verideki ölçüm değerleri küçükten büyüğe sıralandığında gözlem sayısı tekse tam ortaya düşen, çiftse tam ortaya düşen iki değerin ortalamasıdır.
- Yani N değer varsa N tek ise medyan (N + 1) =2. gözlem, çift ise (N=2) : ve (N + 2) =2: gözlemlerin ortalaması medyanı verir.
- Aykırı değerlere karşı daha dayanıklı bir ölçüdür. En büyük veya en küçük değer veri sıralandığında en sonda veya en başta yer alacağından medyanı etkilemez. Bu açıdan aşırı değişken ölçümler içeren verilerde kullanışlıdır.
- Ortalama gibi değerleri doğrudan kullanmaz. Örneğin en büyük değerin değerini daha büyük bir değerle değiştirdiğinizde medyan değeri değişmez.
Örnek 1
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden ortalama izleme süresi:
Örnek 2
Yukarıdaki veriye +1 gözlem ekleyelim:
Tepe Değer – Mod (Mode) Nedir?
Temel Özellikleri
- Mod değeri nitel verilerde (sınıflayıcı ve sıralayıcı ölçekli) daha kullanışlıdır.
- Bir veri tek modlu veya çok modlu olabileceği gibi mod değeri içermeyebilir.
- En sık tekrarlanan değer bir tane ise tek modlu,
- İki değer eşit frekansa sahipse çift modlu (bimodal),
- İkiden fazla değer aynı frekansa sahipse çok modlu (multimodal),
- Her bir değer en fazla bir kez gözlenmişse modsuzdur.
Örnek
Bir YouTube videosunun 15 öğrenci tarafından izlenme süreleri aşağıdaki gibi olsun. Bu değerler üzerinden mod değeri:
Sonuç ve Genel Değerlendirme
Bu yazıda merkezi eğilim ölçüleri konusunu ele aldık. Verinin yapısına bağlı olarak ortalama, medyan (ortanca) ve mod seçimi yapılmalıdır. Sayısal ve dengeli verilerde ortalama, sayısal ama aykırı değerler içeren dengesiz veride medyan (ortanca) ve sayısal olmayan kategorik verilerde ise sıklıkla mod tercih edilir. Seçilen ölçü doğru olduğu oranda temsil kabiliyeti de yüksek olacaktır. Sonraki yazılarımızda özellikle sınıflandırılmış (gruplandırılmış) veride merkezi eğilim ölçüleri hesabı biraz daha fazla matematiksel işlem gerektirdiğinden ayrıca değinmeyi planlıyoruz.
Onikinci yazısını tamamladığımız “adım adım istatistik temelleri” adlı yazı dizisinde alan içinden ve dışından bireylerin sorunsuzca kavrayabileceği formatta birçok içerik hazırlamaktayız. Serinin önceki yazılarına blog adresimizden ulaşabilirsiniz.
Aklınıza takılan soruları, varsa yorumlarınızı bizimle yorum olarak veya iletişim sayfamızdan paylaşmayı ihmal etmeyin. Hepinize bol istatistikli ve analizli günleriz dileriz 🙂 Sonraki yazılarda görüşmek üzere.