Mete Veyisoğlu - mete.vey@yandex.com
Bilişim sektörümüzün öncülerinden Sayın Faruk Eczacıbaşı, yeni çağın kodlarını sunduğu “Daha Yeni Başlıyor” adlı harika kitabında, “ders alınabilecek tarihin süresinin gittikçe kısaldığını” belirtiyor. İnternet ve küreselleşme sonrası çağda; hem akıllı telefon gibi yıkıcı teknolojiler hem de sıklaşan global finansal ve politik krizler nedeniyle iş, politika, spor veya diğer herhangi bir alandaki geçerli kuralların ömrü gittikçe kısalıyor. Üstelik Faruk Bey’in kitabı, koronavirüs pandemisinin henüz yaşanmadığı bir dünyada, 2018 yılında yayınlanmıştı. Pandemi sonrası, belirsizliklerin daha da arttığını ve dünyanın iyice öngörülemez bir hal aldığını söyleyebiliriz.
Havayolu veya perakende gibi birçok sektörde müşteri talebini öngörmek için yapay zeka modelleri kullanılmaktadır. Bu modeller, geçmiş verileri dikkate alarak geleceğe dair öngörülerde bulunur. Pandemi öncesinde şirketlerin karar süreçlerini başarıyla destekleyen bu modeller, pandeminin ekonomide yarattığı yüksek oynaklık nedeniyle işlemez hale geldi. ABD’den MIT Üniversitesi’nin 2020 Aralık ayında düzenlediği “Pandemi Döneminde Veri Analitiği” adlı sunumda bu konuya değinildi ve bir havayolu yöneticisinin şu ifadelerine yer verildi: “Pandemi sürecinin başlarında, 8 hafta boyunca müşteri talebi sıfıra yakın gerçekleşti ve hiçbir öngörü modeli bu veriyi baz alarak herhangi bir öngörüde bulunamaz.”
Belirsizlik o kadar artmış durumda ki, birçok firma geleceği öngörmek için artık sadece en güncel veriyi, bugünün verisini dikkate almak zorunda kalıyor. Çok eskilere değil, sadece iki yıl geriye gitsek, pandeminin yaşanmadığı 2019 yılı verileri bile artık geçerliliği azalmış ve kullanılamayacak veriler olarak görülüyor. Geçmiş verileri bu şekilde bir kenara ittiğimizde, maalesef elimizde kullanabileceğimiz çok az veri kalıyor. Bu durumda, çok az veriyle dahi çalışabilen öngörü modellerine ihtiyacımız var. Peki böyle modeller var mı?
Bir İngiliz ve bir Fransız
Bugün bu soruya evet diyebiliyorsak, bunu 1700’lerin başlarında İngiltere’de dünyaya gelen bir rahip olan Thomas Bayes’e ve çağdaşı ünlü Fransız matematikçi Pierre-Simon Laplace’a borçluyuz. Bayes’in fikir babası olup Laplace’ın geliştirdiği ve bugün Bayes Teoremi olarak bilinen matematiksel formüle dayanan modeller, çok az güncel veri kullanarak dahi öngörüde bulunabilmektedir ve bugün yapay zeka alanında yaygın olarak kullanılmaktadır. Azıcık veriyle dahi öngörü üretebilmelerini sağlayan özellikleri, güncel veriye ek olarak öngörüde bulunan kişinin veya modelin kendi varsayımlarını da hesaba dahil etmeleridir.
İşin ilginci, hepimiz Bayes Teoremi’ne farkında olmasak da aşinayız. Futboldan bir örnek verelim: VAR teknolojisinin olmadığı yıllarda hakemlerin birbirine çok benzeyen faullere bazen kırmızı bazen sarı kart göstermeleri dikkatinizi çekmiştir. Bir faule tanıklık eden hakemin elinde çok az veri bulunur. Bir saniyelik bir aksiyonun tek açıdan (hakemin gördüğü açıdan) görülmesi, eldeki tek veridir. Bu durumda hakemler farkında olmasa da kendi varsayımlarını karar sürecine dahil eder. Bu nedenle hırçın olarak nam salmış futbolcular, daha centilmen olarak tanınan futbolculara kıyasla, aynı faulu yapsalar bile daha koyu renkli kartlar görmüşlerdir.
Şampiyon kim?
Bayes Teoremi, varsayımlarımızı hesaba katması sayesinde çok tutumlu (az veri tüketen) modeller yaratabilir, ancak bu durum modeli kuran veri bilimcilere büyük bir sorumluluk yüklemektedir: Doğru varsayımları seçmek! Futboldan devam edelim ve şampiyonu tahminleyelim: Bu yazının yazıldığı gün itibariyle ligimizin ilk iki sırasında yer alan Beşiktaş (BJK) ve Galatasaray (GS) birbirine çok yakın puanlarda bulunuyor. Güncel verinin, yani puan tablosunun öngörü üretmede bize çok yardımcı olmadığı bu durumda iş gene varsayımlarımıza kalır: “Son bir yılda maç başına en çok puan toplayan teknik direktör ve takımı favoridir” varsayımı ile Sergen Yalçın’lı BJK öne çıkar. “Son on yılda en çok şampiyon olan takım favoridir” varsayımı ile, son on yıldaki şampiyonlukların yüzde 50’sini kazanan GS öne çıkar. Gördüğünüz gibi, iki varsayım da sayısal verilere dayanıyor ve ikisinin de geçerli bir mantığı var. Siz hangisini seçerseniz, şampiyonluk öngörünüzü de o belirleyecektir. (Bence Fenerbahçe’nin de en az diğer iki takım kadar şampiyonluk şansı devam etmektedir, ancak örneğimi sade ve anlaşılır tutmak adına sadece sıralamada ilk ikide yer alan takımları dahil ettim.)
Yarardan çok zarar
İş dünyası için geliştirilen öngörüler de çok sayıda varsayıma dayanır; ve bu varsayımlar geçerli değil ise, ortaya çıkan öngörüler bize yarardan çok zarar getirir. Üstelik burada, modeli kuran kişinin sonucu manipüle etmek için kötü niyetle varsayımları değiştirmesinden bahsetmiyoruz. İyi niyetle ve doğru bir model kurmak adına yapılan varsayımlar da hatalı olabilir; zira her varsayım, sahibinin tecrübelerini yansıtır ve herkes yanılabilir. Bu nedenle, öngörü ihtiyaçlarımızı karşılarken kritik olan iki konuya dikkat etmeliyiz:
1) Kompleks ve havalı yöntemlere aldanmamalı, arka planda kullanılan varsayımları ve matematiksel kurguyu anlamalıyız.
2) Mümkünse birden çok kişinin farklı ve bağımsız modeller oluşturmasını sağlamalı ve her birinin ürettiği öngörüleri birleştirerek karar vermeliyiz.
Not: Bu yazıda kaynak olarak yararlanılan bazı makaleleri benimle paylaşan veri bilimi duayeni Sayın Hamdi Özçelik’e çok teşekkür ederim.
Mete Veyisoğlu - mete.vey@yandex.com