Yapay Zeka Artık Yazdığınız Metinden Gerçekçi Videolar Oluşturuyor

1
OpenAI'ın Sofa programıyla oluşturulan çok sayıda hiper gerçekçi videodan birinin ekran görüntüsü. Görüntü: OpenAI

Üretken yapay zeka sadece bir yılda gülünç videolardan gerçekçi videolara ilerledi. İnsanlığın geldiği bu nokta, bilinmeyen ve tehlikeli bir bölge.

Gerçekçi videolar oluşturan Sora ile ilgili bir şey yazarken başınızı ağrıtmamak zor. Fakat OpenAI’nin önceki gün yaptığı sürpriz yapay zeka duyurusundan sonra elimizde, henüz yasal düzenlemeye tabi olmayan ve yaptıklarının sonucunu düşünmeyen teknoloji endüstrisinin size satmak istediği şeyle ilgili şimdiye kadarki en iyi kanıtlar mevcut. Bu şey ne mi? Meşruluğun, özel hayatın gizliliğinin ve nesnel gerçekliğin sınırlarını zorlayan, görsel yönden gerçekçi medyalar üreten, bolca enerji tüketen, adeta birer kara kutu olan yapay zeka ürünleri.

Belirleyici, özenli ve kapsamlı yasal düzenlemeler olmazsa, internet ortamı artık hiç olmadığı kadar güvenilmez ve neredeyse tanınmaz bir yer hale gelebilir. Hiper gerçekçi tüylü mamutların ve kağıt sanatıyla yapılmış gibi duran okyanus manzaralarının şaşırtıcılığı etkisini yitirirken, CEO Sam Altman’ın en yeni çarpıtma projesi endişe vermeye devam ediyor.

Japonca “gökyüzü” anlamına gelen Sora’nın ardındaki konsept pek yeni değil: Görünüşe göre, sadece kullanıcının yazdığı metinlere dayanarak yüksek çözünürlüklü video oluşturabilen bir yapay zeka programı. Daha basit şekilde ifade etmek gerekirse Sora, metni görüntüye çeviren difüzyon modeliyle dönüştürücü olarak bilinen ve DALL-E‘nin temelinde yatan yapay sinir ağı sistemini birleştiriyor. Genelde metinler gibi devasa veri dizilerini ayrıştırmada kullanılsa da, OpenAI iddialara göre bu dönüştürücü teknolojisini video karelerinde de kullanmak üzere uyarlamış.

“Görünüşe göre”, “iddiaya göre”, “söylenenlere göre”. Sora’yı tarif ederken tüm bu uyarıları kullanmak gerekiyor çünkü MIT Technology Review sitesinin açıkladığı üzere OpenAI, dün yayımlanan örnek kliplere sadece medya organları şirketin “dış uzmanların görüşünü alma” yönündeki resmi açıklamasını beklemeyi kabul etmesinden sonra erişim izni verdi. OpenAI en yeni deneyini tanıttığında bile bunu teknik bir rapor yayımlamadan veya modelin “gerçekte çalışan” arka yüzünü göstermeden yaptı.

Bu şu anlama geliyor: Makul bir gelecekte, dışarıdan tek bir düzenleyici organ, seçilmiş bir yetkili, endüstri gözlemcisi veya mütevazı bir teknoloji muhabiri bile Sora’nın şimdiye kadar yapay zeka tarafından üretilen en tekinsiz medyayı nasıl oluşturduğunu, Altman’ın şirketinin yeni programını eğitirken hangi verileri kullandığını ve bu bir dakikalık videoları oluşturmak için ne kadar fazla enerji gerektiğini bilemeyecek. OpenAI halkla neyi paylaşırsa o kadarını bileceksiniz. Bahsettiğimiz şirketin CEO’su, yapay zeka kaynaklı yok olma tehlikesinin nükleer savaşla eşdeğer olduğunu, fakat böyle bir şeyin olmasını önleme bakımından sadece kendisi gibi fon ve kaynaklara sahip kişilere güvenilebileceğini defalarca söyledi.

Bu noktaya varma hızımız, videoların kendisi gibi baş döndürücü. New Atlas sitesi, dün durumu sağlam bir biçimde ele aldı: OpenAI’nin örnek klipleri hiçbir yönden mükemmel olmasa da, sadece dokuz ayda spagetti yiyen yapay zeka Will Smith’in yer aldığı “korkutucu komediden” kalabalık şehir sokaklarını, nesli tükenmiş hayvanları ve hayali çocukların fantezi karakterlerini betimleyen, görsel gerçekçiliğe sahip, yüksek çözünürlüklü videolara geldik. Benzer teknolojiler bundan dokuz ay sonrasında nasıl görünecek? Hem de ABD’nin modern tarihteki belki de en önemli seçimlerinin birinin arifesinde?

Sora’nın oluşturduğu ucuz hileli tasvirleri özümsediğinizde, bunların doğurabileceği rahatsız edici sonuçları görmezden gelmek zor. Elbette bu videolar teknolojik birer harika niteliğinde. Elbette Sora yenilikçi, eğlenceli, hatta faydalı sonuçlar getirebilir. Peki ya birisi onu “yenilikçi”, “eğlenceli” veya “faydalı” olmayan bir şey için kullanırsa? İnsanlar, herhangi bir üretken yapay zeka programından çok daha maharetli. Şimdiye kadar bu şeylerdeki kısıtlamaları kaldırmak için sadece biraz azme, sabra ve teknolojiyi kötü niyetli kazanımlar için saptırma arzusuna ihtiyaç vardı.

OpenAI gibi şirketler, şu an kötü aktörlerin yeni teknolojik dünyamızı suistimal etmesini önleyecek güvenlik protokolleri ve endüstri standartları geliştirdiklerini söylüyor. Bu dünya, Sora gibi projelerle umarsız şekilde atılmaya devam ettikleri, bilinmeyen bir alan. Ayrıca en temel önlemleri uygulamakta bile fena çuvallamış durumdalar: Deepfake şeklinde adlandırılan videolarda insanların vücutları kötüye kullanılıyor, okullar ChatGPT’den faydalanarak faşist kitap yasaklarına boyun eğiyor ve gerçek ile kurgu arasındaki sınır bulanıklaşmaya devam ediyor gibi duruyor.

OpenAI, şimdilik yakın zamanda Sora’yı halka açma planlarının olmadığını ve “zarar veya tehlikeler yönünden önemli alanları değerlendirmek” için kırmızı takım testleri yürüttüklerini söylüyor. Fakat herhangi bir tür yasal düzenleme direnişi olmadan, OpenAI’nin Sora’yı en kısa zamanda serbest bırakması muhtemel.

Dünkü duyurusunda “Sora, Yapay Genel Zeka’ya ulaşmada önemli bir kilometre taşı olacağına inandığımız gerçek dünyayı anlayabilme ve canlandırabilme kabiliyetine sahip modeller için bir temel görevi görüyor” diyen OpenAI, şirketin insanlardan neredeyse ayırt edilemeyen yapay zeka oluşturma hedefine bir kez daha açık bir şekilde atıf yapıyor.

Sora, gerçek dünyayı anlayan ve canlandıran bir model; en azından gerçek dünyadan geriye ne kaldıysa onu.

 

Yazar: Andrew Paul/Popular Science. Çeviren: Ozan Zaloğlu.

1 Yorum

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz