Bir gün kahvenin diyabet olma riskini azalttığını, kalbe yararlı olduğunu duyuyoruz. Başka bir gün kanser yaptığını öğreniyoruz. Bu örnekleri çoğaltmak mümkün. Çelişkinin nedeni kullanılan araştırma yönteminden kaynaklanıyor. Elde edilen sonuçların olduğundan fazla gösterilmesi de cabası. Tarihi bir örnek vererek açıklayayım.
Kahve kanser mi yapıyor?
1980 yılında bir grup araştırmacı yaklaşık 400 pankreas kanserli hastanın ve bir o kadar da sağlıklı kişinin yeme içme alışkanlıklarını araştırdı. Kanser hastaları arasında kahve içenlerin sayısı daha fazlaydı. Araştırmacılar kahvenin kanser yapıcı olabileceği sonucuna vardı. Halbuki böyle bir sonuca varmak için incelenen denek sayısı oldukça küçüktü. Daha önemlisi, pankreas kanseriyle kahve arasında bir ilişki vardı ama bu ilişki bir sebep sonuç ilişkisi miydi acaba? Nitekim, daha sonra yapılan geniş boyutlu araştırmalar kahve içenlerin çoğunun sigara da içtiğini; esas suçlunun kahve değil sigara olduğunu gösterdi.
Şu veya bu besinin ömrü uzattığı, hafızayı güçlendirdiği, cinsel gücü artırdığı ve benzeri haberleri duyduğunuzda bu örnek aklınıza gelsin. Çoğu zaman, habere konu edilen maddeyle azalttığı veya artırdığı iddia edilen sonuç arasındaki ilişkinin bir sebep sonuç ilişkisi olmayabileceğini hatırlayın.
Burcumuz ve kalbimiz
Usulüne uygun yapılan bilimsel çalışmalarda hangi hasta grubunda, hangi sonuçların analizinin yapılacağı araştırma başlamadan saptanır ve bu kararlara titizlikle sadık kalınır. Veriler toplandıktan sonra bu kararlardan sapmak çoğu zaman yanıltıcı sonuçlar verir. Diyelim kalp krizi geçirenlerde verilecek bir ilacın ölüm riskini azalttığı savının sınandığı bir çalışma yapıldı. Öngörülenin tersine ilacın yararlı olmadığı saptandı.
Daha sonra acaba ilacın yararlı olduğu bir grup hasta var mı diye yapılan istatistik hesapları ilacın 40-50 yaşındaki erkeklerde ölümü önlediğini gösterdi. Sonuç böyle olsa da, ilacın bu yaş grubundaki hastada kullanılmasını savunmak doğru bir yaklaşım değildir.
Burca göre aspirin!
Oxford Üniversitesi araştırmacıları bu tip analizlerin ne kadar sakıncalı olabileceğini gösteren çok güzel bir çalışma yaptılar. Kalp krizi geçirenlerde aspirinin ölüm riskini azalttığının saptandığı ünlü çalışmalarını tamamladıktan sonra hastaları burçlarına göre 12 gruba ayırdılar. İkizler ve terazi burcunda doğmuş olan hastaların aspirinden yarar görmedikleri hatta zarar gördüğü ortaya çıktı. Bir konferansta bu saçma sonuçların bildirilmesi gülüşmelere yol açtı. Şaka bir yana, bu çalışma ağla balık avlar gibi ne çıkarsa diye yapılan analizlerin ne kadar tehlikeli olabileceğini gösteriyor.
Vekil asilin yerini tutmuyor
İyi (HDL) kolesterolü yükselten yeni bir ilacın kalp krizlerlerini ve ölümleri önleyeceği düşünülüyordu. Bu savı sınamak için 15 bin kişi rast gele 2 gruba ayrıldı. Bir gruba yeni ilaç diğerine boş ilaç verildi. Yeni ilacı alanlarda (HDL) kolesterol düzeyleri çok yükseldi (sağda). Ama, yeniden kalp krizi, inme ve ölümlerde azalma olmadı. Aksine artış oldu. Ünlü NEJM dergisinde 2007 de yayımlanan araştırmada ilacın sadece vekil sonuca (HDL) değil asil sonuca (hastalık) üstüne olan etkisi araştırıldığı için gerçek ortaya çıktı.
Yeni bir tedavinin etkinliğinin anlaşılması için karşılaştırmalı çalışmalara gerek vardır. Örneğin, bir ilacın kalp krizi veya erken ölüm riskini azaltıp azaltmadığını sınamak için binlerce hastanın yıllarca izleneceği araştırmalar yapılır. Böyle bir araştırmanın her açıdan maliyeti çok yüksektir. Daha ucuz ve oldukça kısa sürede tamamlanabilecek araştırma biçimleri vardır. Ama, bu yöntemlerin çok önemli kısıtlılıkları olduğu unutulmamalıdır.
Kalp hastalıklarına şifa
Bir örnekle açıklayayım. Kalp krizi geçiren hastanın yeniden kriz geçirme ve erken ölüm riskini azalttığı düşünülen yeni bir ilaç geliştirildi. Bu ilacın kalp krizi veya erken ölüm riskini azaltıp azaltmadığını sınamak yerine, iyi (HDL) kolesterolü standart tedaviye göre ne kadar yükselttiğine bakıldı. Yani asil değil vekil sonuca bakıldı.
İyi kolesterol düzeyleri neredeyse ikiye katlandığı için ilacın kalp hastalıklarına şifa olacağı ilan edildi. Daha sonra, ilacın vekil yani kolesterol üstüne olan etkisine değil, asıl amaca yani kalp krizi ve erken ölüm riskini azaltıp azaltmadığını araştıran bilimsel çalışma sonlanınca gerçek anlaşıldı.
Hatalı yöntem yanlış sonuca götürür
Bir ilacın veya yöntemin diğerinden iyi olduğunu söyleyebilmek için taraf tutmadan iki tarafı eşit şartlarda karşılaştırmak gerekir. Bunu yapmak zannedildiği kadar kolay değildir. Birçok bilimsel çalışmada ya dikkatsizlikten ya da bilmeden tarafgirliğe yol açan etkenler vardır. Bir örnekle açıklayayım.
Sağlık için koşun
Hızlı koşmanın kalp sağlığına yararlı olduğunu düşünüyorum. Bu savımı kanıtlamak için haftada en az 3 gün hızlı olarak 3-5 kilometre koşan 1000 kişinin 5 sene içinde kaçının kalp hastalığı geçirdiğini saptadım. Bunları karşılaştıracağım bir kontrol grubu bulmak için de aynı yaşta ve cinsiyette olan sağlıklı ama koşmayan 1000 kişiyi inceleyip 5 yıl izledim. Koşanların çok daha az kalp hastası olduğunu gördüm. Araştırma sonuçlarım büyük yankı yaptı. İnsanlara sağlıklarını korumaları için koşmalarını tavsiye ediyorum.
İlk anda doğru gibi görünse de dikkatli bakınca iki grup arasında koşma dışında önemli farklar olduğunu gören bilim insanları itiraz etti. Haklılar. Koşanlar arasında fazla kilolu ve şişman olanlar, sigara içenler koşmayan gruptakinden çok daha az. Koşanların daha sağlıklı olmasının nedeni belki de bu özellikler. Üstelik hızlı koşmak zararlı bile olabilir. Ama, bu tarafgirlikle anlamaya imkân yok. Özetle araştırmalarla ilgili tüm seçimlerde ve ölçümlerde tarafgirlikten kaçınmak için azami dikkat göstermek gerekir.
İstatistik her zaman doğru söylemez
Yeni bir ilaç veya tedavi yöntemini eskisiyle karşılaştıran araştırmacılar yeninin üstün olduğunu bulurlarsa aradaki farkın şans eseri ortaya çıkmadığından emin olmak isterler. Bunun için de genel olarak yüzde 5 sınırını kullanırlar. İstatistik hesapları farkın şansa bağlı olma ihtimalinin yüzde 5’den az olduğunu gösteriyorsa sonuçların gerçeği yansıttığı hükmüne varırlar. Halbuki yüzde 5 sınırı bir doğa kanunu değildir.
Bu sınırın altına inmek araştırmada incelenen insan sayısı azaldıkça zorlaşır çoğaldıkça kolaylaşır. Sayı azsa, gerçek farkların bile şansa bağlı olmadığını göstermek imkânsızdır. Sayı arttıkça yüzde 5 sınırının altına inmek kolaylaşır. Öyle ki, 20 bin kişilik bir araştırma yaptığınızda minicik farklar bile istatistiki olarak anlamlı bulunur. Başka bir deyimle yeni ve eski ilaç arasındaki farkın şansa bağlı olma ihtimali çok düşüktür. İstatistiki olarak anlamlı olan bu farkın gerçek hayatta hiçbir anlamı olmayabilir. Örneğin yeni ilacın 500 kişiden birinde daha fazla iyileşme sağladığı kesin olarak ortaya konsa bile bunun pratikte bir yararı yoktur.
Yüzdelere dikkat!
Bir sağlık haberinde yeni bir ilacın saç dökülmesine eski ve oldukça ucuz olan bir ilaca göre yüzde 25 daha etkin olduğu bildiriliyordu. Derhal eczaneye koşmadan önce bu oranın ne ifade ettiğini bilmemizde yarar var. Eski ilacın kaç kişinin saç dökülmesini durdurduğunu bilirsek, ancak o zaman fiyatı 10 kat daha pahalı olan yeni ilacı alıp almamaya karar verebiliriz.
Eğer eski ilacı alan 100 kişinin 40’ında saç dökülmesi duruyorsa yeni ilaçla 50 kişi, yani fazladan 10 kişi yarar görecek demektir. Yapacağımız yatırıma değebilecek bir yarar söz konusu. Buna karşılık eski ilaç 100 kişiden sadece 4’üne yarar sağlıyorsa durup düşünmek gerek. Çünkü yüzde 25 artış, tedavi edilen 100 kişiden 4 yerine 5 kişinin yarar sağlayacağı anlamına geliyor.
Son söz: Bir sağlık haberinde inanılması güç yeniliklerden söz ediliyorsa, inanmadan önce yazılanlar kadar yazılmayanlara da bakıp sorgulamak gerekir.