18.12.2022 - 03:00 | Son Güncellenme:
CEYDA ULUKAYA
CEYDA ULUKAYA- ‘Magic Avatars’ özelliğiyle kullanıcılara yapay zeka destekli avatarlarını üretme imkanı sunan Lensa AI, geçtiğimiz hafta yeni bir sosyal medya akımı yarattı. Her birimizi usta bir ilüstratör elinden çıkmış süper kahraman versiyonumuzla tanıştıran uygulama, aralık ayının ilk haftasında dünya genelinde 4 milyonu aşkın kullanıcı tarafından indilerek de bir rekor kırdı.
Yapay zeka teknolojisinde gelinen aşamayı da gözler önüne seren uygulamanın gördüğü devasa ilgi, metaverse’deki görsel kimliğimiz olan avatar dünyasına kitlesel olarak bir adım daha yaklaşmamızı sağlarken, beraberinde başta biyometrik verilerin güvenliği olmak üzere dijital mahremiyet sorularını da getirdi. Tüm bu soruları, İTÜ Bilgisayar Mühendisliği, Yapay Zeka ve Veri Mühendisliği bölümünden Prof. Gözde Ünal ve Muse VR’dan Talat Alkan’a sorduk.
Prof. Dr. Gözde Ünal
Magic Avatars’ı farklı kılan ne?
Yapay zeka temelli yöntemlerin gündelik hayat uygulamalarında yaygınlaşması ve kullanılması çok güzel. İnsanlar da alışılmamış, gerçeğe bu kadar benzer ancak yapay zeka tarafından üretildiğini bildikleri çıktıları heyecanla takip ediyorlar. Magic Avatars da bence zor ulaşılır bir şeyi basitçe ulaşılır hale getirdiği için bu kadar sevildi: Gerçeğe uygun, ancak daha estetik bir görüntü. Bu gerçekçi olduğu kadar sanatsal çıktıların elde edilmesinin altında difüzyon modeline dayalı Kararlı Difüzyon (Stable Diffusion) isimli açık kaynaklı yapay zeka modeli yatıyor. Bu model, görsel üretme konusunda önceki üretici modellerden farklı bir yapıya sahip. Yüklenen veri kümesini kullanarak fotoğrafların özelliklerinin dağılımını öğrenebiliyor ve veri kümesinde olmayan ancak benzer fotoğraflar üretebiliyor. Difüzyon modelleri birçok farklı yapay zekâ modelini içerebilir, ancak hepsinin ortak özelliği yeni veriler üretebilme yeteneğidir. Magic Avatars uygulaması da fotoğrafları temel alarak kullanıcının genel olarak nasıl göründüğünü öğreniyor ve farklı ortam ve şekillerde o kişinin görselini üretme yeteneği kazanıyor.
Lensa AI uygulamasının yaratıcısı olan Prisma Labs uygulamaya yüklenen fotoğrafların serverlarda tutulmadığını ve avatarlar yaratıldıktan sonra sistemden silindiğini savunuyor. Ancak uygulamanın kullanıcının avatarlarını oluşturmak üzere her kullanıcıya ayrı bir model oluşturup bu modelleri serverlarda tutuyor olması ve buna ek olarak üçüncü parti uygulamaların Lensa AI üzerinden kullanıcı verilerine erişebiliyor olması ciddi soru işaretleri yaratıyor ve uygulamanın kullanımını riskli hale getiriyor. Bu anlamda kullanıcının rızası dışında biyometrik verilerin satılması ya da hacker’ların eline geçmesi olasılıklar dahilinde. Dahası Lensa AI’ın eğittiği modeller, kullanıcının cinsiyeti ve etnik kökenine göre ürettiği fotoğraflarda ayrımcılığa yol açabilmekte ve kullanıcının isteği dışında kullanıcının fotoğraflarını mahrem hale getirebilmekte.
İTÜ Lab'ın da çalışma konusu
Yedi yıldır faaliyet gösteren İstanbul Teknik Üniversitesi Bilgisayar ve Bilişim Fakültesi bünyesindeki İTÜ Vision Laboratuvarı’nın ana çalışma konularından biri de “Generative AI”, yani “Yapay Zeka ile Veri Üretimi”. Laboratuvarın güncel çalışmaları arasında, Magic Avatars uygulamasına da konu olan “Kararlı Difüzyon Modeli”ni geliştirerek görsel üretme
projesi de yer alıyor.
Talat Alkan - Muse VR Kurucusu
Metaverse’e bir adım daha mı?
Lensa, gerçekçi Metaverse temsilleri üreten Epic Games’in ‘Meta Human’ ve Meta’nın ‘Reality Lab’ uygulamaları aksine, stilize edilmiş ve trend oluşturma potansiyeline sahip avatarlarlar oluştururken yeni bir estetik konsensus sahasında yapay zekanın söz sahibi olacağına dair bir tartışmanın altını çiziyor. En ayırt edici özelliği, yapay zekanın ortak duyu ve beğeniye daha hitap eden bir stili üsluplaştırmakta yakaladığı başarı. Bunu iki başlık altında görebiliriz; ilki yapay zekanın eskisine göre teknik problemleri gidermekte yakaladığı başarı. Ortaya çıkan sonuçlar, eskilerine nazarla renk, leke dağılımı, boşluk-doluluk oranı ve benzeri teknik parametreler bakımından daha iyi eğitilmiş bir makine öğrenmesi algoritması ile karşı karşıya olduğumuzu gösteriyor. İkinci ve daha önemli olduğunu düşündüğüm kısım, yapay zekanın estetik bir konsensus sahasına hükmetmeye başlamasının iyice belirginleşmesi. Makinelerin öğrenme, benzetme, stili transfer etme gibi yeteneklerinin bu şekilde gelişmeye devam etmesi kuşkusuz estetik normların yeni bir evrende şekillenmesine sebep olacak.
Metaverse hayatı simule eden bir temsil dünyası. Avatarlar da bu simülasyondaki görüntülerimiz; bir anlamda metaverse’deki görsel kimliklerimiz. Epic Games’in Meta Human programı, Metaverse’de dilediğimiz görsel temsilleri oluşturmamız için üretilmiş profesyonel araçlara sahip bir modül. Görünüşün ötesinde mikro mimiklerden, küçük vücut kusurlarına kadar kolayca işlemeyi sağlayan bir avatar motoru. Tek amacı insanların kendini temsil edeceği ‘meta görsel kimlikleri’ profesyonel yardıma fazla ihtiyaç kalmadan oluşturabilmek. Tabii ki bu içerik, iskelet sistemi, hareket, konuşma, mimik gibi insanı taklit eden birçok etkileşimi gerçekleştirecek derecede tasarlanmış kompleks bir yapı. Meta ve Oculus grubunun avatar anlayışı, aynı şekilde hiper realistik seviyede bir iletişimin ve gerçek zamanlı mimiklerin aktarılması ekseninde devam ediyor.
Zaman meselesi
Lensa AI’yı burada ayırdeden şey, henüz simülasyona hazır bir görsel kimlik sunmamasına rağmen - yani üç boyutlu bir model ve konuşma, hareket özelliklerine sahip değil- stil transferi konusunda insanları kendi görsel referanslarını esas alarak, tamamen makine öğrenmesiyle gerçekçi değil ama ‘ideal’ veya güzelleştirilmiş, cazipleştirilmiş bir görüntüye kavuşturması. Lensa, Metaverse avatarlarına kafa yoran rakiplerinin aksine, gerçeği manipüle etme gücünü ustaca kullanıyor. Stil transferini bu kadar yaygın ve kolay ulaşılabilir hale getiren Lensa AI’in, bunu başka alt yapılarla harmanlayarak 2 veya 3 boyutlu farklı ve yetkin temsillere çevirmesi sadece zaman alacaktır.
Başka neler var?
Yapay zeka desteğiyle fotoğraflarınızdan farklı konseptlerde avatar üretmeyi sağlayan başka uygulamalar da mevcut. Fotoğrafları anime karakter portrelerine dönüştürmesiyle bilinen Meitu AI Art, bazıları ücretli olmak üzere 200’den fazla efekt ve filtre özelliklerine sahip. Yüzünüzün beş farklı açıdan fotoğrafını yükleyerek istediğiniz stilde avatar üretmenizi sağlayan Wonder da bu uygulamalardan biri. Pro versiyonu ücretli olan uygulama için haftalık 60 ila 72 lira ödemeniz gerekiyor. Portre fotoğrafların yanı sıra evcil hayvan fotoğraflarını da işleyebilen Dawn AI ise sayısız filtre özelliğiyle farklı stillerde avatar üretmeyi sağlayan bir diğer popüler ücretli uygulama.
Nasıl çalışıyor?
Magic Avatars özelliğiyle Lensa AI üzerinden görsel oluşturmak için uygulamaya en az 10 görsel yüklemeniz gerekiyor. Görsellerin aynı kişiye ait yakın çekim selfie olması, farklı arka planlarda ve açılarda çekilmiş olması gerekiyor. Grup fotoğrafları, çocuk fotoğrafları, çıplak fotoğraflar ya da yüzün kapalı olduğu kareler kabul edilmiyor. Kriterleri karşılayan görselleri yüklemeniz halinde, 45 ila 90 lira karşılığında üç farklı paket seçeneği sunuluyor. Uygulama, avatarları yaklaşık 40 dakika için oluşturuyor.