Simpson Paradoksu
İstatistiksel verilerin önemi gün geçtikçe artıyor. Hastanelerden, siyasi partilere, hava yolu şirketlerinden, deterjan alan sade bir vatandaşa kadar artık herkes istatistiksel verilere göre karar veriyor. İnternet kullanıcılarının yüzde 40'ı şu uygulamayı kullanıyor sen de kullan, bu sabun bakterilerin yüzde 99'unu öldürüyor bunu al, bu ilaç hastaların yüzde 80'ini tedavi etti bunu kullan... Liste uzayıp gidiyor. Elbetteki bilimsel yöntemlerle elde edilen bu sonuçların güvenilir olduklarını düşünüyoruz. Fakat bazı durumlarda rakamlar değiştirilmeden, rakamların gösterdiği sonuçlar tamamen farklı yorumlanabilir. Ayrıca güvendiğimiz bu sonuçlar bilerek bize farklı şekilde gösteriliyor olabilir.
Şöyle bir senaryo düşünelim. Farzedelim ki baş ağrısı problemimiz var. Doktora gittik ve muayene olduk. Doktor tedavi için 2 farklı ilacın olduğunu söyledi. Bu ilaçlara A ve B ilaçları diyelim. Doktora hangi ilacı önerdiğini sorduk. Doktor bize ilaçlar için yapılmış test sonuçlarını gösterdi. Her iki ilaç için iki farklı test yapılmış. İlk testte A ilacı 90 kişi üzerinde denenmiş ve yüzde 70 başarı sağlamış, B ilacı 10 kişi üzerinde denenmiş ve yüzde 80 başarı sağlanmış. İkinci testte A ilacı 10 kişi üzerinde denenmiş ve yüzde 40 başarı sağlanmış, B ilacı ise 90 kişi üzerinde denenmiş ve yüzde 50 başarı sağlanmış. Aşağıdaki tabloda veriler daha net şekilde görülebilir.
Test No | A'nın Başarı Oranı | B'nin Başarı Oranı |
---|---|---|
Test 1 | 63/90 = Yüzde 70 | 8/10 = Yüzde 80 | Test 2 | 4/10 = Yüzde 40 | 45/90 = Yüzde 50 |
İstatiklere baktığımızda B ilacının başarısı iki testte de A ilacından daha fazladır. Herhalde bu rakamlar önümüze konsa tereddütsüz B ilacını seçerdik. Fakat toplam kişi sayısı göz önüne alındığında sonuç tamamen farklılaşmaktadır. Tabloda gördüğünüz gibi A ilacı toplamda 100 kişi üzerinde denenmiş ve 67 kişide başarılı olmuş, B ilacı ise yine toplam 100 kişide denenmiş ve 53 kişide başarılı olmuş. Yani toplam kişi sayısını göz önünde bulundurursak, A ilacının başarısı yüzde 67 iken B ilacının başarı oranı yüzde 53'dür.
Test No | A'nın Başarı Oranı | B'nin Başarı Oranı |
---|---|---|
Test 1 + Test 2 | 67/100 = Yüzde 67 | 53/10 = Yüzde 53 |
Verilere toplam olarak baktığımızda sonuç tamamen farklılaşmaktadır. İşte bu duruma Simpson paradoksu adı verilir. Simpson paradoksu gruplanmış ve gruplanmamış verilerin zıt sonuçlar gösterdiği durumlardır.
Paradoksu anlamak için, paradoks için en bilinen örneği inceleyelim. 1973 yılında Berkeley Üniversitesi cinsiyet ayrımı yaptığı gerekçesiyle dava edilmiştir. Davanın dayanak noktası istatistiksel verilerdir. Bu verilere göre üniversiteye başvuru yapan erkek öğrencilerin yüzde 44'ü kabul edilirken, kız öğrencilerin yüzde 35'i kabul edilmiştir. Üniversiteye başvuran kız öğrenci sayısı 4321 iken erkeklerin sayısı 8442'dir. Yani toplamda 3714 erkek öğrenci kabul edilirken, sadece 1512 kız öğrenci kabul edilmiştir. Rakamlara baktığımızda üniversitenin gerçekten de erkek öğrencilere daha fazla yer verdiğini görürüz. Bu veri, toplam yani gruplanmamış veridir. Eğer veriler gruplanırsa sonucun tamamen farklılaştığını görebiliriz. Mahkeme verileri detaylandırmak istemiş ve her bölüm için kabul edilen erkek ve kız öğrencilerin sayısını istemiştir. Aşağıdaki tabloda üniversitenin en büyük 6 bölümünü ve bu bölümlere kabul edilen öğrenci sayılarını görebilirsiniz.
Bölüm | Erkek Öğrenci | Kız Öğrenci | ||
---|---|---|---|---|
Başvuran | Kabul Edilen | Başvuran | Kabul Edilen | |
A | 825 | Yüzde 62 | 108 | Yüzde 82 |
B | 560 | Yüzde 63 | 25 | Yüzde 68 |
C | 325 | Yüzde 37 | 593 | Yüzde 34 |
D | 417 | Yüzde 33 | 375 | Yüzde 35 |
E | 191 | Yüzde 28 | 393 | Yüzde 24 |
F | 373 | Yüzde 6 | 341 | Yüzde 7 |
Gördüğünüz gibi 6 departmanın 4'ünde kız öğrencilerin kabul oranı, erkek öğrencilerin kabul oranından fazladır. Eğer A bölümünün verilerine bakarsak, erkek ve kız öğrencileri kabul etme oranının en fazla olduğu bölümün A olduğunu görürüz. F ise kabul oranı en az olan bölümdür. Başvuran erkek öğrencilerin yüzde 10'u A bölümüne, yüzde 4'ü F bölümüne, başvuran kız öğrencilerin ise yüzde 2'si A'ya, yüzde 8'i ise F'ye başvuru yapmışlardır. Yani erkekler en fazla öğrenci kabul eden bölüme, kız öğrenciler ise en az öğrenci kabul eden bölüme daha fazla sayıda başvuru yapmışlardır. Bu nedenle toplam yüzdeler gruplanmış yüzdelere göre büyük farklılıklar göstermektedir.
Ürünlerin üstünde yazan, reklamlarda ve araştırmalarda bizlere gösterilen sonuçlar aslında tam tersini söylüyor olabilir. Emin olmak için Simpson paradoksunu göz önünde bulundurmalı, gruplanmış ve gruplanmamış verileri bizzat kendimiz incelemeliyiz.
İstatistiksel olarak doğru sonuçların farklı yorumlanabildiği başka yöntemler de mevcuttur. Bu yöntemlere Grafiklerle Nasıl Kandırılıyoruz adlı makalemden ulaşabilirsiniz.
- Yayın Süresi : 2636 Gün
- Konu Sayısı : 277 Bilim Konuları : 118 Teknoloji Konuları : 42 Web-Tasarım Konuları : 42 İlginçler Konuları : 63 Gezi Konuları : 12 En Popüler : Sonsuz İşlemleri 246123 Kere En Çok Yorum Alan : Logaritma Nedir, Ne İşe Yarar, Gerçek Hayatta Nerelerde Kullanılır? 19 Kere En Çok Değerlendirilen : Napier'in Kemikleri (Matematik) 151 Kere
Satrançta Piyonun Geçerken Alması Kuralı (En Passant)
En passant kuralı nedir, ne zaman uygulanır...
Işık Hızında Bağıl Hız
Işık hızında giden cisimler için bağıl hız hesaplamaları...
Newton Karantinada Neler Yaptı?
Newtonun karantina günleri ve icatları...
Çamaşır Suyu Nedir? Nasıl Temizler?
Çamaşır suyunun yapısı, kullanım alanları ve dikkat edilmesi gerekenler...
Dünyanın Yaşını Nasıl Biliyoruz?
Dünyanın yaşını hesaplama yöntemleri...
Salgın Hastalık Dereceleri : Pandemik, Epidemik, Endemik, Sporadik
Pandemik, Epidemik, Endemik, Sporadik Nedir?
Kahve Günlükleri : Kahve Çekirdeği Kavurma Dereceleri
Hafif, orta, orta-koyu, koyu kavrulmuş kahve çekirdeklerinin özellikleri ve farkları...
Kahve Günlükleri : Kahve Demleme Yöntemleri
Kahve demleme yöntemleri ve farkları...
Kahve Günlükleri : Kahve Çeşitleri ve Ölçüleri
Popüler kahve çeşitleri ve ölçüleri...
Kahve Günlükleri : Arabica ve Robusta
Arabica ve Robusta kahve çekirdekleri ve farkları...
Sayıların Sınıflandırılması (Matematik)
Matematikte sayıların sınıflandırılması : Kompleks, Sanal, Gerçek, Doğal, Rasyonel, İrrasyonel...
Websiteniz İçin Bedava Güvenlik Sertifikası (SSL Sertifikası)
Tamamen bedava güvenlik sertifikası nasıl elde edilir, nasıl yüklenir?
Wi-Fi Şifresini Görme (Windows 7 - 10)
Programsız, kodsuz wifi şifresini görme yöntemi.
Kolay Ezberleme Yöntemi : Anımsatıcılar
Kolay ezberleme yöntemlerinden anımsatıcılar : Mnemotekni
Tarayıcılarda Ön Bellek İşlemleri (Normal Yükleme - Tam Yükleme - Ön Belleği Boşaltma)
Tarayıcılarda normal yükleme ve tam yükleme ne demektir, nasıl yapılır?
Takip, Reaksiyon, Fren ve Durma Mesafesi
Reaksiyon, fren, durma ve takip mesafesi nasıl hesaplanır, bilimsel detaylar.
Bilgisayarda Müzik Nasıl Yapılır?
Sadece bilgisayar programları kullanarak gerçekçi müzik nasıl oluşturulur?
Beden Kitle İndeksi Hesaplama ve Değerlendirme
Bu uygulama ile Vücut Kitle İndeksinizi hesaplayabilir ve sonucu değerlendirebilirsiniz.
Hidrojen Peroksit (H2O2) ve Özellikleri
Hidrojen peroksit nedir, sağlık açısından ne gibi etkileri vardır?
Photoshop'ta Ortalama İşlemleri
Photoshop'ta ortalama işlemleri nasıl yapılır?
Bu kısımdan sitemizdeki gelişmelerden haberdar olabilirsiniz.
- Abonelik Sistemi kaldırıldı. 11.03.2020
- Arama Motoru Google Özel Arama olarak değiştirildi. 15.10.2019
- Yıllık sunucu bakımı tamamlandı. 04.10.2019
- Konulara kaynaklar eklendi. 10.07.2019
- SSL sertifikası eklendi. 31.05.2019
Gitar çalmayı öğrenmek, yeteneğinizi geliştirmek, popüler tab ve akorlar için gitaregitim.net sitesini ziyaret etmeyi unutmayın.