Yapay Zeka Neden Elleri Düzgün Tasvir Edemiyor?

0
Çok yaklaştı. Görüntü: Dall-E OpenAI/Popular Science

Metinleri görüntüye dönüştüren yapay zeka yazılımları, çok kısa sürede uzun ve belki de tedirgin edici bir mesafe kat etti. Fakat insan anatomisinin bir parçası var ki, yapay zeka bunu hâlâ çok iyi kavrayabilmiş değil: Ellerimizden bahsediyoruz. Yapay zeka ile üretilen eller biraz tuhaf görünüyor. Florida Üniversitesinde çalışan sanatçı ve yardımcı yapay zeka ve sanat profesörü Amelia Winger Bearskin, yapay zeka yazılımlarının şimdiye dek bir ‘elin’ tam olarak neye benzediğini pek anlayamadığını belirtiyor. “Yapay zekanın eğitildiği görüntülerde yer alan eller oldukça ince ayrıntılar içeriyor” diyor Bearskin. “Bu görüntülerde eller genellikle bir nesneyi tutuyor. Bazen de başka bir insana tutunuyorlar.” Son birkaç ayda bir miktar ilerleme kaydedildiyse de, halen geliştirme yapılması gereken büyük bir alan var.

Kulağa ilk başta tuhaf gelebilse de, vücudumuzdaki uzuvların karmaşıklığına baktığımızda durumun neden böyle olduğu hemen ortaya çıkıyor. Çok sayıda eklem noktası, çeşitli pozlar, cilt kırışıklıkları, damarlar ve sayısız diğer ince detay çok iyi kavranmadığı sürece, oluşturulan el tasvirleri hızla tuhaf ve hatalı görüntülere dönüşebilir. Dahası yapay zeka yazılımlarının bakarak öğrendiği el fotoğrafları, yüzler ile tam vücutların yer aldığı fotoğraflar kadar büyük ve yüksek çözünürlüklü değil. Fakat yapay zeka halen bu durumla mücadele ederken (bunu da çoğunlukla son derece şaşırtıcı, gülünç ve hatta can sıkıcı sonuçlarla yaparken), Çin’deki Hefei Bilim ve Teknoloji Üniversitesinde çalışan araştırmacılar şaşırtıcı derecede basit bir çözüm üzerinde çalışıyor: Bir yapay zekayı el oluşturma üzerinde çalışması ve bunu geliştirmesi için özel olarak eğitiyorlar.

Kısa süre önce yayımlanan bir makalede araştırmacılar, sinirsel ışıma alanları veya NeRF şeklinde bilinen bir şey uğruna daha yaygın kullanılan yayınımlı görüntü üretme teknolojisinden kaçındıklarını anlatıyor. New Scientist dergisinin aktardığına göre daha önce hem Google Araştırma hem de Waymo şirketi, sinirsel ağlara dayanan bu 3 boyutlu modelleme yönteminden yararlanarak eşsiz ve büyük ölçekli şehir manzarası modelleri oluşturmuş.

Görüntü: Çin Bilim ve Teknoloji Üniversitesi

 

Makalenin özet kısmının bir bölümünde, “NeRF’e elin haritasını ve ışın kompozisyon stratejisini dahil ederek, her iki el için de etkileşim noktalarını doğal şekilde ele almayı ve nadir gözlenen alanların geometrisi ile dokusunu tamamlamayı mümkün kıldık” yazarken, araştırma takımının “HandNeRF” programının hem tek hem de iki elin etkileşimiyle uyumlu olduğu belirtiliyor. Bu güncellenmiş işlemde, bir veya birden fazla elin çoklu görünüm içeren görüntüleri başlangıçta “kullanıma hazır bir iskelet tahmincisi” tarafından kullanılarak, el pozları parametreler ile içeriden ifade ediliyor. Araştırmacılar sonrasında, üst uzuvlarımızın şekil ve yüzey bakımından daha gerçekçi görüntü barındıran sonuçlarını oluşturan HandNeRF yazılımı aracılığıyla bozulma alanlarını faaliyete geçiriyor.

NeRF görüntülemeyi eğitmek zor olsa da ve metinden görüntüye olan sonuçların tamamını kendi üretemese de, New Scientist bu programın yayınım teknolojisiyle birleştirilmesinin yapay zekanın ürettiği eserler için yeni bir yol sunabileceğini belirtiyor. Fakat o zamana kadar çoğu yazılımcı, yapay zekanın insan elini (tabiri caizse) pek anlayamamış olması sorununu bir şekilde halletmek zorunda.

 

Yazar: Andrew Paul/Popular Science. Çeviren: Ozan Zaloğlu.

1 Yorum

  1. Bu nasıl bir cümle:
    “Kısa süre önce yayımlanan bir makalede araştırmacılar, sinirsel ışıma alanları veya NeRF şeklinde bilinen bir şey uğruna daha yaygın kullanılan yayınımlı görüntü üretme teknolojisinden kaçındıklarını anlatıyor.”

    Anlayan bana da anlatsın.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz