Düşünenlerin Düşüncesi

Düşünenlerin Düşüncesi

dusunce@milliyet.com.tr

Tüm Yazıları

Mete Veyisoğlu

mete.vey@yandex.com

Öğrencilik yıllarınızda, gece-gündüz hazırlanmanıza karşın kötü not aldığınız sınavlar oldu mu? Veya iş yaşamınızda, yeni bir proje için onlarca senaryo çalışmanıza rağmen hayatın karşınıza öngöremediğiniz bir senaryo çıkardığı? Saatlerce prova yaptığınız kritik bir sunumda, hazırlandığınız onca soru yerine hiç beklemediğiniz ve sizi duraklatan bir soru aldığınız? Bu durumların tesadüf olmadığına inanıyorum. Bir amaca yönelik aşırı hazırlık yapmak, bir noktadan itibaren o amaca ulaşmamıza engel olabiliyor. İstatistik ve veri biliminde önemli yer tutan ‘aşırı öğrenme’ (overfitting) kavramı, bu durumun sebebi için bize bir ipucu sunuyor.

Haberin Devamı

‘Aşırı öğrenme’yi bir örnekle açıklayalım: Bir bankanın firmalara vereceği kredilerin geri ödenme ihtimalini öngörecek bir model yaratmak istiyoruz. İlk aşamada, geçmişte kredi verilen firmaların çeşitli değişkenlerini (ciro, karlılık, firmanın sektörü, firma yaşı, vb) ve bu geçmiş kredilerin geri ödenme sonuçlarını (geri ödendi veya ödenmedi) içeren tarihsel veri setimiz ile modeli eğitiriz. Model, bu verileri kullanarak, firma değişkenleri ile kredi geri ödeme sonucu arasındaki ilişkileri öğrenir. İkinci aşamada ise model, öğrendikleri ışığında öngörü yapar.

Müzikten gürültüye

İlk aşamada doğal refleksimiz, modele ekleyebildiğimiz kadar veri eklemektir. “Ne kadar çok veri, o kadar iyi tahmin” varsayımında bulunuruz. İşte ‘aşırı öğrenme’ kavramı tam da bu noktada karşımıza çıkar: Modele eklediğimiz değişkenler arttıkça, bir noktadan sonra tahminlerimiz bozulmaya başlar! Peki neden?

Uyumla çalan bir senfoni orkestrasına sürekli yeni bir enstrüman eklersek, sonunda müzikten ziyade baş ağrıtan bir gürültü dinleriz. Benzer şekilde, öngörü modeline eklenen her yeni değişken, modeldeki gürültüyü artırır.  Çünkü; eklediğimiz bazı değişkenler (örneğin firmanın yaşı) ile ilgilendiğimiz sonuç (kredi geri ödeme durumu) arasında, süreklilik arz etmeyen ve sadece geçmiş verimizin ait olduğu döneme özgü tesadüfi ilişkiler bulunabilir. Model, bu tesadüfi ilişkileri de öğrenir ve öngörülerinde kullanır. Ancak geçmişte yaşanan tesadüfler gelecekte tekrarlamayabilir! İşte o zaman modelimiz hatalı öngörüler üretir. Bu duruma ‘aşırı öğrenme’ diyoruz.

Haberin Devamı

Girişteki örneklere dönelim: Bir sınavda yüksek not almak isteyen öğrenci, konuların temel mantığını anlamakla yetinmeyip geçmiş soruları da ezberleyene kadar çalışırsa ve sınavda bu kalıp sorular yerine yaratıcı düşünme gerektiren sorular çıkarsa; mekanikleşmiş zihin sürpriz sorular karşısında esneklik gösteremez. Veya, iş yaşamında bir sunuma aşırı hazırlanırsak, kendi kabullerimize göre ‘mükemmel’ olanı yakalarız; oysa bizim için mükemmel olan şey diğer insanlar için her zaman mükemmel değildir! Paradoksal bir şekilde, daha iyi hazırlanmak  için çaba harcarken diğer insanların beklentilerinden uzaklaşmış oluruz.

Acemi şansı

Bir oyunu veya bir mesleği yeni öğrenen kişi, hocasını veya mentörünü geçtiğinde ‘acemi şansı’ deriz. Ancak şans bu durumu açıklayan tek faktör değil: Bir konuyu yeni öğrenen kişi, ilk denemesinde sadece en temel birkaç kuralı dikkate alarak karar verir; uzmanlar ise çok sayıda parametreyi dikkate alarak karar sürecini gürültüye boğabilmektedir. Matematikçi Nassim Taleb, ‘Antikırılganlık’ adlı kitabında (2012) bu durumu, karşıdan karşıya geçerken insanların göz renklerinin istatistiğini tutan ve bu esnada yaklaşan kamyonu görmeyen birine benzetiyor. Karar süreçlerimizle ilgili bir tavsiye de veriyor: “Bir karar verirken tek ve güçlü bir sebep yeterlidir. Birden çok sebep öne sürüyorsanız, bilin ki kendinizi inanmadığınız bir karara ikna etmeye çalışıyorsunuz.”

Haberin Devamı

Fazla verinin öngörülerimizi bozması gibi, fazla seçeneğimizin olması da doğru seçimi yapma ihtimalimizi azaltıyor olabilir mi? Psikolog Barry Schwartz ‘Bolluk Paradoksu’ adlı kitabında (2004) bunu iddia ediyor.  Diyelim bilgisayar alacağız ve online alışveriş sitesinde bütçemize uygun 20 alternatif çıktı. Bu kadar fazla seçeneğimiz olması iki sorun yaratıyor: Birincisi, en doğru seçimi yapabilmek için çok sayıda alternatifi kıyaslamak zihnimizi yoruyor. İkincisi, seçeceğimiz 1 bilgisayardan sağlayacağımız faydaya değil, seçemediğimiz 19 bilgisayar nedeniyle kaçırdığımız faydalara odaklanarak mutsuz oluyoruz! Akademisyen Sheena Iyengar bir süpermarkette yaptığı ünlü deneyinde, 6 çeşit reçel sunulan müşterilerin 24 çeşit reçel sunulan müşterilere göre 6 kat daha fazla satın alma yaptığını tespit etmişti. Prof. Iyengar’ın diğer çarpıcı araştırma sonuçları için TED konuşmalarını dinleyebilirsiniz.

Acemi şansının sırrı

Mete Veyisoğlu

mete.vey@yandex.com