Craiyon: Siz Söyleyin, Yapay Zeka Hayal Etsin

0
403
Yıldız Savaşları filminden tanıdığımız Chewbacca'nın bir günü. Görüntü: Craiyon/Shuman Ghosemajumder

1904 yılında doğan İspanyol ressam Salvador Dali, yaptığı gerçeküstü resimlerle biliniyor: Eriyen saatler, bacakları bir böceğinkine benzeyen filler, biçimsiz insan yüzleri ve uzuvları. Önceki ismi Dall-E mini olan Craiyon, Haziran başlarında sahneye çıkan yeni bir yapay zeka yazılımı. Mahkemede ifade veren mayonez şişesi, bir çekicin nasıl yenileceğini anlatan wikihow yönergeleri ve “Sessiz Tepe” filminden pizza yiyen bir hemşire gibi kullanıcıların komik talepleri doğrultusunda görüntüler üreten bu yazılım, sürrealist sanatın yeni kaynağı şeklinde görülmeye başlandı.

Görüntüler komik. Program da ortaya çıkardığı eğlenceli sanat eserleri sebebiyle internette yoğun ilgi görüyor. Kullanıcılar bir cümle yazarak (herhangi bir cümle), yapay zekanın yazılan bu ifadeyi görüntüye dönüştürmesini izleyebiliyorlar. Craiyon, metinlerden gerçekçi görüntüler ve sanat eserleri oluşturan yapay zeka araştırma laboratuvarı OpenAI‘nin Dall-E teknolojisine dayanan açık kaynak kodlu bir proje. Kullanıcılar, Craiyon’un oluşturduğu sanat eserlerinin çoğunu kahkahayla karşılıyor. Fakat bu gibi teknolojiler daha da gelişip yaygınlaştıkça, kötüye kullanma tehlikesi de artıyor ve bu gülünecek bir konu değil.

Craiyon veya önceki adıyla Dall-E mini, OpenAI’nin resmi olarak bu yılın Nisan ayında yayınladığı Dall-E 2’den sonra çıkmış. Dall-E 2, internetteki milyarlarca resim ile bunlara eşlik eden açıklamalar arasında ilişki kurarak çalışıyor. Craiyon da benzer şekilde çalışıyor fakat çok daha küçük bir ölçekte oluşturulmuş. Boris Dayma’nın öncülük ettiği ve OpenAI’nin orijinal Dall-E programından 27 kat daha küçük olan projede, modele bilgi sağlamak üzere üç veri setinden yaklaşık 15 milyon görüntü kullanılmış. Craiyon’un sunucusu ise makine öğrenim modelleri ve araçları sağlayan ve “iyi makine öğrenimini demokratik hale getirme” görevinde olduğunu belirten Hugging Face şirketi.

Kullanıcılar neredeyse istedikleri her görüntüyü oluşturabiliyorlar. Fakat sonuçlar gerçeğe benzemekten ziyade bir acayip görünüyor. Teknoloji şirketi F5’in eski yapay zeka müdürü Shuman Ghosemajumder, oluşan beklenmedik kusurların durumu daha komik ve cazibeli hale getirdiğini söylüyor. “Komik olmasının bir sebebi de, görüntülerin mükemmel olmaması” diyor Ghosemajumder. “İzlenimciliğe dayalı görüntüler var, kabusvari türden görüntüler var, çılgın görünen görüntüler var. Tüm bunlara bakmak ilgi çekici ve paylaşmak da eğlenceli.”

Ghosemajumder, bu tür teknolojilerin halk nezdinde birkaç farklı aşamadan geçtiğini görebildiğini söylüyor. İnsanlar ilk başta böyle bir programın kapasitesini merak ediyorlar. Merak edip öğrenen insanlar, halihazırda internette gördüğünüz üzere oluşturabilecekleri şeylerin karmaşıklığını da keşfediyorlar. Bunun ardından gelen ikinci aşama, daha çok salt eğlenceden insanların üretebilecekleri şeylerin değerini anlamasına olan geçişi temsil ediyor.

“Özel bir amaç için temel canlandırmalar oluşturabilir ve teknolojinin güncel durumunu daha iyi anlayabilirsiniz. Bu sayede, söz konusu teknolojinin daha gelişmiş hallerini gelecekte nasıl kullanmak isteyebileceğinize yönelik planlar yapmaya başlayabilirsiniz” diyor Ghosemajumder.

Ghosemajumder’e göre bu teknolojilerin algılanmasındaki üçüncü aşama, yüksek kaliteli yapay videolar gibi gelecekte çok daha gelişmiş yeniliklerin temelini nasıl oluşturabilecek oldukları.

Fakat bu icatlar gitgide geliştikçe, sakıncalı ve yanlış yönlendirici görüntülerin tehlikesi de artıyor.

Ghosemajumder, şimdilik Craiyon’un görüntülerinin yeterince “düşük kaliteli” olduğunu ve kullanıcıların bu sayede söz konusu görüntülerin yapay zeka tarafından oluşturulduğunu bildiklerini; ör. bu görüntülerin mahkemede şahitlik yapan bir mayonez şişesinin çekilmiş gerçek görüntülerini yansıtmadığını söylüyor. Fakat bir şeyin bir yapay zeka platformunda mı oluşturulduğunu yoksa dijital olmayan dünyada mı yakalandığını belirlemek zorlaştığında, insanların internetteki yanlış bilgi kampanyalarına aktarabilecekleri görüntüler oluşturması daha kolay hale gelecek.

“Bunlar sadece Tupac veya Dart Vader’in izlenimci versiyonları olmayacak” diyor Ghosemajumder. “Bunun yerine, ‘vay be şuna bak, sanki gerçek bir insan bir şey yapıyor gibi’ olacak.” Bir siyasetçiyi hiç yapmadığı bir şeyi yapıyormuş gibi gösteren bir görüntü oluşturabilirim ve nihayetinde bunun üzerinden bütün bir hikaye oluşturup, bunu yanlış bilgi yaymak için kullanabilirim.”

OpenAI’nin geliştiricileri muhtemel kötüye kullanım tehlikeleriyle boğuşurken, Dall-E 2 şimdilik halka açık değil. (Craiyon da ona benziyor fakat halk tarafından üretilen açık kaynaklı bir versiyon.) Benzer şekilde, Google’ın metinleri görüntüye dönüştüren programı Imagen da platformuna erişim sağlamıyor. Her iki durumda da şirketler, programlarını test edip operasyonları ve eğitim verilerini iyileştirmeleri, güvenliği temin etmeleri ve sanatı daha iyi hale getirmeleri için araştırmacılar ile sanatçıları işe almış. Genel bir yayın öncesinde sınırlı bir yayın yapmanın “yaygın kabul gören bir yazılım ilkesi” olduğunu belirten Ghosemajumder, bu durumun teknoloji daha da karmaşık hale geldikçe giderek önem kazacağını düşünüyor.

Nihayetinde Craiyon gibi teknolojilerin sağladığı en büyük güçlerden biri de, daha fazla insanın olguları şimdikinden daha kolay görselleştirebilmesini sağlaması. Ghosemajumder, bunu yüksek kaliteli içeriğin demokratikleştirilmesi şeklinde görüyor.

“İnsanların yaratıcılığını serbest bırakıyor ve daha etkili ileşitim kurmasına olanak sağlıyor” diyor Ghosemajumder. “İnsanların, görselleştirebilmek istedikleri farklı kavramlara ait canlandırma ve fotoğrafları çok daha verimli ve etkili şekilde oluşturmasını sağlayabilir.”

Ghosemajumder’a göre kendisinin Craiyon kreasyonu, Chewbacca bir büroda çalışacak olsaydı günün nasıl geçeceğini tarif eden bir dizi görüntüden oluşuyor.

 

Yazar: Maria Parazo Rose/Popular Science. Çeviren: Ozan Zaloğlu.

CEVAP VER

Please enter your comment!
Please enter your name here