Roma’daki Trevi Çeşmesi veya New York’taki Top of the Rock gibi dünyanın önemli turistik bölgelerine ait halka açık fotoğraflarını kullanan araştırmacılar, görünümü zamanla değişen 3 boyutlu görüntüler meydana getirmişler.
Çoğunlukla etiketsiz ve tarihsiz on binlerce fotoğrafı inceleyip sentezleyen derin öğrenme teknolojisinin kullanıldığı yöntem, bilgisayar görüşü uzmanlarından neredeyse altmış yıldır kaçmış bir sorunu çözüyor.
Cornell Üniversitesi’nde bilgisayar bilimleri yardımcı profesörü olan Noah Snavely, “Bu yeni yöntem, kafanızı hareket ettirmenize ve mesela bir çeşmeyi farklı açılardan görmenize olanak sağlamakla kalmıyor; ayrıca zamanı değiştirmenizi de sağlıyor” diyor.
“Eğer tatilde Trevi Çeşmesi’ne gittiyseniz, gittiğiniz zamana göre farklı şekilde görünür; geceleyin, alttan gelen projektör ışıklarıyla aydınlanır. Öğleden sonra ise hava bulutlu olmadığı sürece güneş ışığıyla aydınlanır” diyor Snavely. “Bu düzensiz fotoğraf koleksiyonlarından, günün saati ve havaya dayalı olarak bir sürü görünüş şekli öğrendik. Bu sayede tüm alanı keşfedebilir ve eş zamanlı olarak sahnede gezinebilirsiniz.”
Bir yerin fotoğrafik yönden gerçekçi şekilde temsil edilmesi, geleneksel bilgisayar görüşü için zorlayıcı bir durum. Bunun sebeplerinden biri de, oluşturulması gereken doku sayısının fazla olması. “Gerçek dünya görünüş bakımından çok çeşitli ve farklı malzeme tiplerine sahip; parlak şeyler, su, ince yapılar” diyor Snavely.
Bir diğer sorun ise mevcut verilerin tutarsız olması. Bir şeyin uzay ve zamanda mümkün olan her açıdan nasıl göründüğü (ışık alanı şeklinde biliniyor), bir sahnenin etrafına yüzlerce web kameranın konması ve gece gündüz veri kaydedilmesiyle belirlenebilirdi. Fakat bunu yapmak pratik olmayacağından, araştırmacılar da durumu telafi etmek üzere bir makine öğrenimine başvurmak zorunda kalmış.
Melanie Lefkowitz/Cornell Üniversitesi. Ç: O.