İstatistik Bilimi (Siyasette pek kullanılır)



2010 ila 2013 yılları arasında Amerika’da aile başına düşen ortalama gelir ciddi şekilde artmıştı.

84 bin dolarlardan 87 bin doların üstüne çıkmıştı. Birkaç yıl içinde.

Ama o dönemde Amerikan halkına gidip “hayırlı olsun geliriniz artmış” deseydiniz büyük ihtimalle tatsız olaylar yaşanabilirdi.

Zira. Ortalama değil de “medyan” olarak bildiğimiz ve istatistikte ortanca ya da orta değer olarak bilinen değere baktığınızda orası çok başka bir şey söylüyordu.

Ortalama gelir gayet güzel artarken “orta değer” tam tersine düşmüştü.

49 bin dolarlardan 46 bin dolarlara kadar inmişti.

Tabi o zaman Amerikalı yöneticiler “ortalama geliri yükselttik” diye böbürleniyorlardı. Ve bunda da gayet haklılardı. Gerçekten de yükselmişti. Çünkü istatistik yalan söylemez. Fakat siz istatistiği kullanarak kitleleri çok güzel aldatabilirsiniz.

Burada olan neydi peki?

Aslında halk dilinde çok güzel açıklanıyor bu durum. Zengin daha da zenginleşmiş, fakir daha da fakirleşmişti. Milyar dolarlık isimler servetlerine birkaç milyar dolar daha eklediğinde kendi servetleri ile birlikte ortalama geliri de yukarı çekmişlerdi. Herkesin 20 aldığı bir sınavdan 90 alan öğrenci gibi…

Ortalamaların aldatıcı dünyasına hoş geldiniz.

Sürekli hayatımızda olan ortalamalar. Baştaki örnekten de anlayacağınız üzere doğru okunmadığında çok aldatıcı olabiliyorlar.

Medyanın en sevdiği değerlerdir. Siyasi atışmalar, vaatler ve iddiaların temelini oluştururlar.

O nedenle gelin istatistikte ortalamaları nasıl okumalıyız bakalım.

İstatistikte farklı ortalamalar söz konusudur. Bunlar bildiğimiz ortalama, aritmetik ortalama olarak da bilinir. Medyan yani ortanca değer ve tepe değer olarak da bilinen mod.

Önce klasik ortalamadan bahsedelim.

Aslında gayet adı üstünde. Elinizde bir veri grubu olsun. Veri grubu derken de bir grup insan, bir grup hayvandan bahsediyoruz. İstatistikte hepsi ve her şey veridir. Misal. 10 insanın toplamda 50 tane karpuzu olsun. Burada ortalama karpuz sayısı 5’tir. Karpuzlar verilerimiz.

Ya da iki arkadaş dışarı çıkıyorsunuz. Birinizde 10, diğerinde 20 lira var. Ortalama 15 liranız var. Tabi arkadaşınızın cömertliğinden bağımsız olarak bu 15 liralık bir şey alabileceğiniz anlamına mı geliyor?

Maalesef hayır. Keşke öyle olsaydı değil mi?

Buradan anlayacağımız şey şu. Ortalama bize genel anlamda verilerle ilgili bilgi verir. Bireysel olarak tek tek verilere veya kişilere odaklanmaz. 10 kişinin ortalama 5 karpuzu olması bu insanların yarısının hiç karpuzu olmadığı anlamına da gelebilir.

O nedenle bu tip bir ortalama hesabı ancak “normal dağılım” için güvenilir ve anlamlı bilgiler verebilir. Normal dağılımdan kastımız da herkesin gerçekten 5 karpuzu olmasından bahsediyoruz. Eskiden mesela 13. 14. Yüzyılda ortalama yaşam süresinin 30 olduğunu söylemiştik. Bu kağıt üzerinde doğru bir bilgi. Ancak eğer bize bu sayıyı veren faktörleri doğru okumazsak sanki insanlar 30 yaşına geldiğinde ölüyorlarmış gibi bir algı ortaya çıkıyor. Hayır. Durum elbette bu değildi. Bu kadar kısa bir yaşam süresinin ortaya çıkmasının tek nedeni yenidoğan ölümlerinin inanılmaz yüksek olmasıydı. Tıbbın henüz gelişmediği bu dönemlerde yenidoğanların çok sık ölmesine rağmen aslında bir şekilde yetişkinliğe ulaşabilenler gayet 50lerine 60’larına kadar yaşayabiliyorlardı.

Ortalamayı aşağı ya da yukarı çeken verilerin orta değeri daha az etkilemesini istiyorsanız bu durumda “medyanı” yani orta değeri kullanmanız kimi durumlarda daha sağlıklı olacaktır.

Medyan değerinde elinizdeki tüm verileri tek tek hesaplamaya dahil etmezsiniz. Bir arkadaşınızın 2, sizin 1, başka bir arkadaşınızın da 3 kedisi varsa burada sayıları küçükten büyüğe doğru sıraladığınızda medyanın yani ortadaki sayının 2 olduğunu görürsünüz.

Ama 4 kedisi olan başka bir arkadaşınız geldiğinde sıralamada ortada bir sayı olmaz. 2 ve 3 ortadadır. Bu durumda medyanı hesaplama konusunda farklı görüşler olsa da genel olarak kabul edilen hesaplama bu iki sayının ortalaması, yani 2,5 medyandır. Evet. 2,5 kedi. İstatistik kedileri bizim sevdiğimiz kadar sevmiyor yani…

Ne kadar örnek o kadar iyi. Başka bir örnekle devam edelim.

Bir arkadaş grubunuz var. Her birinizin yıllık geliri 20 bin dolar. Ortalamanız da medyanınız da 20 bin dolar. Fakat bir tane çok zengin arkadaşınız var. Elon Musk olsun mu? Olsun. Yıllık şahsi kazancı 100 milyon dolar. Elon Musk sizinle kahve içmeye geliyor. Birden hepiniz zenginleşiyorsunuz. Evet. Odadaki ortalama gelir 9 milyon doları geçiyor. Hadi gidip o istediğiniz arabayı alın hemen…

Tabi durum keşke böyle olsaydı değil mi? Medyanda bir değişiklik yok. Hatta medyana baktığınızda Elon Musk’ın geliri de 20 bin dolar olacaktır. Burada da bir sıkıntı ortaya çıkıyor işte.

Buna şu açıdan bakarsak daha iyi anlaşılacaktır. Online alışveriş sitelerindeki ürünlerin puanlarına baktığınızda bazı ortalamalar görürsünüz. Bir ürünün mesela 200 5 yıldızı, 200 de 1 yıldızı varsa baktığınızda 3 yıldızlı olduğunu görürsünüz.

Garip olan şu. Kimse 3 yıldız vermedi bu ürüne. Tıpkı 2,5 kedi olamayacağı gibi 3 yıldız da yok aslında.

İşte bu durumda son ortalamamıza bakmamız gerekiyor. Tepe değer olarak bildiğimiz mod.

Fransızca’da “A la Mode” olarak kullanılan Mode yani Moda, yani popüler olan anlamına gelen bu değer bize elimizdeki verilerin içinde en sık tekrarlayan değerleri verir. Ürünümüzün puan ortalaması 3,5 olmasına rağmen “moduna” baktığımızda karşımıza 1’ler ve 5’ler çıkacaktır.

Yani bunu gerçek hayatta şöyle düşünebiliriz. Bir restoranınız var. Restorana müşteriler en çok öğlen ve akşam yemeklerinde geliyor. Bu saatlerin ortalamasını aldığınızda bu durumda restoranınızın saat 3 buçuk gibi en popüler olduğu gibi bir sonuç çıkabilir. Bu durumda tüm planınızı buna göre mi yaparsınız? Elbette hayır. Bu nedenle verileri “mod” açısından da değerlendirmek çok önemlidir.

O nedenle elimizdeki verilerin dağılımı açısından ortalamaya mı, medyana mı yoksa moda mı baktığımız her şeyi değiştiriyor.

Normal, adil, dengeli bir dağılım söz konusu ise bunların hepsi size aynı sonucu verecektir. Sapma sıfır olacaktır. Ancak aralarında fark olduğu zaman ciddi bir sapma söz konusu demektir.

Yani modunuz ve medyanınız veya ortalamanız birbiri ile uyumsuz ise bu elinizdeki verilerin bir tarafında, bir tartı gibi çok daha fazla ağırlık bulunduğunu gösterir. Gelir dağılımında olduğu gibi. Belirli bir grubun elinde büyük bir servet bulunuyorsa karpuz örneğinde olduğu gibi sizin elinizde hiç karpuz olmasa bile size istatistiği göstererek “bak. Burada karpuzun olduğu görülüyor. Yalan söyleme” diyebilirler. Siz de ya hayali karpuzunuz ile mutlu mesut yaşarsınız ya da “yok işte kardeşim, yalan mı söylüyorum?” diyebilirsiniz.

Bunu da zaten en baştaki Amerika’daki gelir dağılımı örneğinde konuşmuştuk.

Ne kadar zam istemeniz gerektiği konusunda bu yaklaşımı uygulayabilirsiniz. Bunun için elbette referans alabileceğiniz veriler olması gerekiyor. Bazı internet siteleri birçok sektör için şirketlere göre maaş dağılımını veriyor. Ya da bazı forumlarda insanlar hangi pozisyonda ne kadar kazandığını tartışıyor. Bu verileri alarak bir excel dosyası hazırladığınızda her pozisyon için bir ortalama, medyan ve mod karşılaştırması yaptığınızda aslında piyasaya göre ne kadar az ya da ne kadar çok kazandığınızı görebilirsiniz. Bu durumda ne kadar zammı hakettiğinizi de. Yani patronunuzun yanına giderek belgeleri ile birlikte hakkınız olanı isteyebilirsiniz.

Birçok durumda istatistiğin ne kadar hem doğru hem de aldatıcı olabileceğini bol bol konuşacağız.

Ve en önemlisi istatistiği kullanarak hangi sorulara cevap aramamız gerektiğini de. Ve elimizdeki bilgilerin bu sorulara cevap verip vermediğini de.

Evet. İstatistik bize karar verme konusunda yardımcı olabilir. Fakat otoritelerin bize sunduğu verileri ve sözde gerçekleri ancak kendi aklımızla yorumladığımızda ve bol bol şüphe ile harmanladığımızda, her duyduğumuza şüphe ile yaklaştığımızda doğru kararı verebiliriz.










Kaynaklar

https://bebarbilim.net/zengin-zenginlestikce-siz-de-zenginlesiyorsunuz-ortalamalarin-aldatici-dunyasi/

https://matizle.com/tag/medyan/

Yorumlar

Bu blogdaki popüler yayınlar

Çöp DNA (İnsan DNA' sının %98' i)

Bakım Yönetimi

Matrix Felsefesi ve Platon' un Mağara Alegorisi