
Geniş dil modelleri yapay zeka alanında gerçekleşen etkileyici bir ilerleme. Fakat insan seviyesinde kabiliyetlere ulaşmaya uzağız.
Yapay zeka yüz yıllardır bir hayal olmuştu fakat hesaplama gücü ve veri analizinde kaydedilen devasa ilerleme sebebiyle daha yeni “viral” oldu. ChatGPT gibi geniş dil modelleri (LLM’ler) aslında çok ileri bir otomatik tamamlama formu. Bu kadar etkileyici olmalarının sebebiyse eğitim verisinin internetin tamamından oluşması. LLM’ler gerçek yapay genel zeka formülündeki içeriklerden biri olabilir ama formülü tamamı olmadıkları kesin; ayrıca muhtemelen diğer bazı bileşenlerin ne olduğunu henüz bilmiyoruz.
ChatGPT sayesinde hepimiz, nihayet yapay zekayı tecrübe edebiliyoruz. Bütün ihtiyacınız bir internet tarayıcısı. Sonrasında gezegendeki en ileri yapay zeka sistemiyle doğrudan konuşabiliyorsunuz; 70 yıllık çabanın parlak başarısıyla. Ayrıca gerçek yapay zeka gibi görünüyor; yani hepimizin filmlerde gördüğü yapay zeka gibi. Peki bu durum, gerçek yapay zekanın formülünü nihayet bulduğumuz anlamına geliyor mu? Yapay zeka için yolun sonu artık görünüyor mu?
Yapay zeka insanlığın en eski hayallerinden birisi. En az antik Yunanistan’a ve tanrıların demircisi Hephaestus efsanesine kadar gidiyor. Hephaestus’un metal yaratıklara hayat verme gücü varmış. O zamandan beridir mitoloji ve kurguda bu temanın farklı yorumları ortaya çıkmış. Fakat yapay zeka 1940’ların sonlarında bilgisayarın icadıyla makul görünmeye başlamış.
Simgesel yapay zeka için bir formül
Bilgisayarlar talimatları takip eden makinelerdir. Onlara verdiğimiz programlar, ince detaylı talimatlardan fazlası değildir; bilgisayarın sadık şekilde takip ettiği formüllerdir. İnternet tarayıcınız, eposta istemciniz ve kelime işlemcinizin hepsi, bu inanılmaz derecede detaylı talimat listesinden ibarettir. Bu yüzden eğer “gerçek yapay zeka” mümkün olsaydı (insanlar kadar kabiliyetli bilgisayarların olması hayali), o zaman o da böyle bir formül ile aynı kapıya çıkardı. Yapay zekayı gerçeğe dönüştürmek için tüm yapmamız gereken şey doğru formülü bulmak. Peki böyle bir formül nasıl görünürdü? Ayrıca ChatGPT, GPT-4 ve BARD’la (doğru isim vermek gerekirse, geniş dil modelleri [LLM’ler]) ilgili son zamanlardaki heyecan göz önüne alındığında, nihayet gerçek yapay zekanın formülünü bulduk mu?
Yaklaşık 40 yıldır yapay zeka yapma girişimlerine yön veren temel görüş, bilinçli zihni modellemeyi kapsıyordu; yani bilinçli varlığımızı meydana getiren düşünceler ve muhakeme süreçlerini. Bu yaklaşıma simgesel yapay zeka adı veriliyordu çünkü düşüncelerimiz ve muhakememiz, simgelerden oluşan (harfler, kelimeler ve noktalama işaretleri) dilleri kapsıyor gibi görünüyordu. Simgesel yapay zeka, bu simgesel ifadeleri yakalayan formülleri bulmaya çalışmanın yanısıra bu simgeleri manipüle ederek muhakeme ve karar vermeyi tekrarlamayı ihtiva ediyordu.
Simgesel yapay zeka bir miktar başarı elde etmiş fakat insanlar için önemsiz görünen devasa büyüklükteki bir görev aralığında göz alıcı bir başarısızlığa uğramıştı. Bir insan suratını tanımak gibi basit bir görev bile simgesel yapay zekanın ötesindeydi. Bunun sebebi, yüzleri tanımanın algılama gerektiren bir iş olması. Algılama gördüğümüz, duyduğumuz ve hissettiğimiz şeyi anlama problemi. Çoğumuz algılamayı büyük oranda çantada keklik görüyoruz; hakkında pek düşünmüyoruz ve şüphesiz onu zekayla ilişkilendirmiyoruz. Fakat simgesel yapay zeka, algılama gerektiren problemleri çözmeye çalışmada yanlış bir yoldu.
Sinirsel ağlar geliyor
Yapay zeka için alternatif bir formül de zihni modellemek yerine beyinde gördüğümüz yapıları modellemeyi içeriyor. Sonuçta insan beyinleri, günümüzde insan zekasını meydana getirebildiğini bildiğimiz tek varlıklar. Bir beyne mikroskop altında bakarsanız, nöron adı verilen ve uçsuz bucaksız ağlarda birbirine bağlanan devasa miktarda sinir hücresi görürsünüz. Her bir nöron, kendi ağ bağlantılarındaki örüntüleri arıyor. Nöron bir örüntüyü tanıdığında komşularına sinyaller gönderiyor. Bu komşular da karşılığında örüntü arıyor, bir örüntü gördüklerinde kendi denkleriyle iletişim kuruyorlar ve bu böyle devam ediyor.

Mantıklı bir biçimde açıklayamıyoruz ancak bu devasa nöron ağları bir şekilde öğrenebiliyor ve nihayetinde akıllı davranışlar meydana getiriyor. Nöral ağlar alanı, esasen 1940’lı yıllarda doğmuş ve söz konusu nöron ağlarının elektriksel devrelerle taklit edilebileceği fikrinden ilham almıştı. Günümüzdeki nöral ağlar, elektrik devrelerinden ziyade yazılımlarda gerçeğe dönüştürülüyor ve açık konuşmak gerekirse nöral ağ araştırmacıları aslında beyni modellemeye çalışmıyor. Fakat kullandıkları yazılım yapıları (çok basit hesaplama aygıtlarından oluşan çok geniş ağlar), ilhamını beyinlerde ve sinir sistemlerinde gördüğümüz sinirsel yapılardan alıyor.
Çeşitli zamanlarda revaçta olup çeşitli zamanlarda gözden düşen (özellikle de 1960’ların sonu ve 1980’lerin ortalarında) sinirsel ağlar üzerinde 1940’lı yıllardan bu yana devamlı olarak çalışılıyor ve bu ağlar sıklıkla simgesel yapay ile rekabet halinde olarak görülüyor. Fakat sinirsel ağların kararlı biçimde çalışmaya başlaması geçtiğimiz on yıl içinde oldu. Geride bıraktığımız on yılda yapay zekayla ilgili gördüğümüz tüm bu cümbüş aslında sinirsel ağların bir dizi yapay zeka probleminde hızlı ilerleme göstermeye başlamasından kaynaklanıyor.
[İlgili: Yapay zeka hayatınızdaki olayları önceden tahmin edebilir]
Sinirsel ağların bu yüzyılda kalkışa geçmesi ise ne yazık ki sıradan sebeplere dayanıyor. Elbette yeni sinirsel ağ yapıları ve onları yapılandıran algoritmalar gibi bilimsel ilerlemeler oldu. Fakat gerçekte, günümüzdeki sinirsel ağların ardındaki ana fikirler 1980’ler kadar eski zamanlarda biliniyordu. Bu yüzyılın getirdiği şey ise bol miktarda veri ve bol miktarda hesaplama gücü oldu. Sinirsel bir ağı eğitmek için ikisi de gerekiyor ve ikisi de bu yüzyılda bolluğa ulaştı.
Geçtiğimiz zamanlarda haberlere çıkan yapay zeka sistemlerinin hepsinde sinirsel ağlar kullanılıyor. Örneğin Londra merkezli yapay zeka şirketi DeepMind’ın geliştirdiği ve Mart 2016’da dünya şampiyonu bir oyuncuyu yenen ilk Go yazılımı olan meşhur AlphaGo’da, her biri 12 sinirsel katmana sahip iki sinirsel ağ kullanılıyor. Bu ağları eğitecek veriler, internet üzerinden oynanan önceki Go oyunlarından ve ayrıca yazılımın kendi kendine oynadığı oyunlardan geliyor; yani yazılımın kendi karşı oynadığı oyunlardan. Son yıllarda manşetlere çıkan yapay zeka sistemleri de (Microsoft destekli yapay zeka firması OpenAI’ın ChatGPT ve GPT-4’ünün yanısıra Google’ın BARD’ı) sinirsel ağlar kullanıyor. Son gelişmeleri farklı kılan şey ise sadece büyüklükleri. Bu modellerle ilgili her şey akıllara durgunluk veren ölçeklerde.
Devasa güç, devasa veri
OpenAI’ın 2020 yazında duyurduğu GPT-3 sistemini düşünün. ChatGPT’nin altında yatan teknoloji bu. Söz konusu teknolojide çığır açan bir dönüm noktasının sinyalini veren LLM de buydu. GPT-3’ü meydana getiren bu sinirsel ağlar devasa boyutta. Sinir ağlarıyla ilgili çalışma yürüten insanlar, bir ağın büyüklüğünü belirtirken onun “parametre” sayısından bahsederler. Bu bağlamda bir “parametre”, ya tekli bir nöron ya da nöronlar arasındaki bir bağlantı olan bir ağ bileşenidir. GPT-3’ün toplamda 175 milyar parametresi varken, GPT-4’ün 1 trilyon parametresi olduğu söyleniyor. Karşılaştırma yaparsak, bir insan beyninde toplamda 100 milyar nöron gibi bir rakam bulunuyor ve bunlar 1.000 trilyon kadar fazla sinaptik bağlantıyla bağlı. Mevcut LLM’ler devasa olsa da insan beyninin ölçeğinden hâlâ uzaktalar.
GPT’yi eğitmek için kullanılan veri 575 gigabayt metinden oluşuyor. Belki bunun kulağa fazla gelmediğini düşünüyorsunuzdur; sonuçta bunu sıradan bir bilgisayarda depolayabilirsiniz. Fakat bunlar video, fotoğraf veya müzik değil, sadece yazılı sıradan metinler. Üstelik 575 gigabaytlık yazılı sıradan metin, hayal edilemeyecek kadar büyük bir miktar; bir insanın hayatı boyunca okuyabileceğinden çok ama çok daha fazlası. Tüm bu metinleri nereden almışlar peki? Dünya Çapında Web’i indirmişler. Hepsini. Her internet sayfasındaki her bağlantı takip edilmiş, metin çıkarılmış ve sonrasında süreç tekrarlanarak, web üzerindeki her bir metin parçası elde edilene değin her bağlantı sistematik olarak takip edilmiş. İngilizce Vikipedi, toplam eğitim verisinin sadece %3’ünü meydana getiriyormuş.
[İlgili: ‘Yapay zeka’nın babası’, insanlığı tehdit edeceğinden korktuğu çalışması için Nobel Ödülü kazandı]
Peki ya tüm bu metni işleyecek ve bu devasa ağları eğitecek bilgisayar? Bilgisayar uzmanları tekli bir aritmetik hesaplamayı kastederken “yüzer nokta işlemi” veya “FLOP” terimini kullanıyor; yani bir FLOP, tek bir ekleme, çıkarma, çarpma veya bölme eylemi anlamına geliyor. GPT-3’ü eğitmek için 3^1023 FLOP gerekmiş. Bizim naçizane insan deneyimlerimiz, bizi bu kadar büyük sayıları anlamak için donatmıyor. Şu şekilde ifade edelim: Eğer GPT-3’ü 2023 yılında yapılan sıradan bir masaüstü bilgisayarda eğitmeye çalışsaydınız, o kadar FLOP’u yürütebilmek için 10.000 yıl gibi bir süre devamlı olarak çalışması gerekirdi.
Tabii ki OpenAI GPT-3’ü masaüstü bilgisayarda eğitmedi. Binlerce özel yapay zeka işlemcisi içeren ve aylar boyunca durmadan çalışan çok pahalı süperbilgisayarlar kullandılar. Üstelik bu hesaplama miktarı ucuz da değil. GPT-3’ü eğitmek için gereken bilgisayar süresi, serbest piyasada milyonlarca dolar tutar. Diğer her şeyden ayrı olarak bu durum, bir avuç büyük teknoloji firması ve ulus devletler haricinde ChatGPT gibi sistemleri inşa etmeye çok az organizasyonun parasının yeteceği anlamına geliyor.
LLM çatısı altında
Akıllara durgun veren bütün bu ölçeklerine rağmen, LLM’ler aslında çok basit bir şey yapıyor. Akıllı telefonunuzu açtığınızı ve eşinize “ne zaman” kelimeleriyle bir metin mesajı yazmaya başladığınızı düşünün. Telefonunuz sizin için o metni tamamlayacak şeyler önerir. Örneğin “eve geliyorsun” veya “yemek yiyoruz” gibi şeyler önerebilir. Bunları önerir çünkü telefonunuz bunların, “ne zaman”dan sonra belirmesi en muhtemel kelimeler olduğunu tahmin ediyordur. Telefonunuz bu tahmini göndermiş olduğunuz bütün metin mesajlarına dayanarak yapar ve bu mesajlara göre onların, “ne zaman”ın en muhtemel tamamlayıcıları olduğunu öğrenmiştir. LLM’ler de aynı şeyi yapıyor ama gördüğümüz üzere bunu devasa miktarda daha büyük bir ölçekte yapıyorlar. Bu eğitim verileri sadece sizin metin mesajlarınız değil, dünyada dijital formatta bulunan bütün metinler. Bu ölçek ne getiriyor? Epey kayda değer bir şey; ve beklenmeyen bir şey.

ChatGPT veya BARD’ı kullandığımız zaman farkına vardığımız ilk şey, çok doğal metin üretmede son derece iyi oldukları. Bu şaşırtıcı bir şey değil; bana yapmak için tasarlanmışlar ve aslında o 575 gigabayt metnin bütün meselesi de bu. Fakat beklenmedik şey, LLM’lerin henüz anlamadığımız şekillerde başka kabiliyetler de kazanması: Üzerinde eğitildikleri muazzam metin külliyatı içerisinde, bir şekilde dolaylı olarak anlaşılması gereken kabiliyetler.
[İlgili: Microsoft’un yeni yapay zeka sistemi doktorlardan 4 kat daha doğru teşhis koyuyor]
Örneğin ChatGPT’den bir metin parçasını özetlemesini isteyebiliyoruz ve genelde övgüye değer bir iş çıkarıyor. Birtakım metinlerdeki önemli noktaları çıkarmasını veya metin parçalarını karşılaştırmasını isteyebiliyoruz ve bu görevlerde de epey iyi görünüyor. Yapay zeka alanında çalışanlar GPT-3 2020 yılında yayımlandığında LLM’lerin gücü karşısında alarma geçse de; dünyanın geri kalanı sadece ChatGPT Kasım 2022’de yayımlandığında durumun farkına vardı. Birkaç ay içerisinde yüz milyonlarca kullanıcı çekti. Yapay zeka on yıldır sık sık gündeme geliyordu fakat ChatGPT yayınlandığında basında ve sosyal medyada oluşan heyecan eşi benzeri görülmemiş cinstendi: Yapay zeka viral oldu.
Yapay zeka çağı
Bu noktada söyleyip rahatlamam gereken bir şey var. ChatGPT sayesinde nihayet yapay zeka çağına ulaştık. Her gün yüz milyonlarca insan, gezegendeki en karmaşık yapay zeka ile etkileşime giriyor. Bunun için 70 yıllık bilimsel emek, sayısız kariyer, milyarlarca ama milyarlarca dolar yatırım, yüz binlerce bilimsel makale ve aylar boyunca en yüksek hızda çalışan yapay zeka süperbilgisayarları gerekmişti. Dünyanın nihayet ulaştığı yapay ise… istem tamamlama oldu.
Şu an trilyon dolarlık firmaların geleceği tehlikede. Kaderleri… istem tamamlamaya bağlı. Tam da cep telefonunuzun yaptığı şeye. Bu alanda 30 yıldan uzun süre çalışan bir yapay zeka araştırmacısı olarak, durumu çok kırıcı bulduğumu söylemem lazım. Aslında rezil bir durum. Sonunda en büyük primi yapacak yapay zeka versiyonunun bu olacağını kim tahmin edebilirdi ki?
Yapay zekada ne zaman hızlı bir ilerleme dönemi görsek, birisi sonunda bu işin bittiğini söylüyor; yani artık gerçek yapay zekaya giden yolda olduğumuzu. LLM’lerin başarısına bakıldığında, şimdi de benzer iddiaların öne sürülmesi şaşırtıcı değil. Dolayısıyla biraz durup bununla ilgili düşünelim. Eğer yapay zekada başarı gösterirsek, o zaman makinelerin bir insanın yapabildiği her şeyi yapması gerekir.
İnsan zekasının iki ana dalını düşünün: Birinde salt zihinsel kabiliyetler varken, diğeri fiziksel kabiliyetleri içeriyor. Örneğin zihinsel kabiliyetler arasında mantıksal ve soyut muhakeme yapmak, sağduyu muhakemesi (yere düşen bir yumurtanın kırılacağını anlamak veya Kansas’ı yiyemeyeceğimi anlamak gibi), sayısal ve matematiksel muhakeme, problem çözme ve planlama, doğal dil işleme, mantıklı bir zihin durumu, bir faaliyet, hatırlama hissiyatı ve empati duyma yeteneği. Fiziksel kabiliyetler arasında duyusal anlama (yani beş duyumuzdan gelen girdileri yorumlama), hareketlilik, yön bulma, el mahareti ve hareketleri, el-göz eşgüdümü ve içalgı yer alıyor.
[İlgili: Yapay zekayla oluşturulan bu büyükanne, kedisini anlatarak dolandırıcılara engel oluyor]
Bunun, kapsamlı bir insan kabiliyeti listesinden uzakta olduğunun altını çiziyorum. Fakat günün birinde gerçek yapay zekamız olursa (bizim kadar yetkin yapay zeka), o zaman elbette tüm bu kabiliyetlere sahip olur.
LLM’ler gerçek yapay zeka değil
Söylenecek en açık şey, LLM’lerin bu fiziksel kabiliyetlerin hiçbirine uygun bir teknoloji olmadığı. LLM’ler gerçek dünyada hiç bulunmuyor ve robotik yapay zekanın teşkil ettiği güçlüklerin, LLM’lerin ele alması için tasarlandığı şeylerle hiç ama hiç alakası yok. Ayrıca robotik yapay zekadaki ilerleme, LLM’lerdeki ilerlemeden çok daha düşük olmuştu. Belki şaşırtıcı gelebilir ama robotların el mahareti gibi kabiliyetlerinin çözülmesine daha çok var. Dahası, LLM’ler bu güçlükler için çözüme götüren hiçbir yol sergilemiyor.
Elbette bir yapay zeka sisteminin salt bir yazılım zekası olduğunu düşünebilirsiniz, o halde LLM’ler yukarıda listelenen zihinsel kabiliyetlerle kıyaslandığında nasıl biçimleniyor? Bunlar arasında LLM’lerin sadece doğal dil işlemede gerçekten önemli bir ilerleme kaydettiği iddia edilebilir; yani sıradan insan dillerinde etkili şekilde iletişim kurabilmede. Burada şaşırtıcı bir şey yok; bunun için tasarlanmışlardı.
Fakat insan benzeri iletişimde sergiledikleri göz kamaştırıcı yeterlilik, belki de diğer şeylerde gerçekte olduklarından çok daha yetkin olduklarına inanmamıza yol açıyor. Bir miktar yapay mantıksal muhakeme ve problem çözme gerçekleştirebiliyorlar fakat bunlar şu anda yüzeysel. Belki de doğal dil işlemenin ötesinde bir şey yapabiliyor olduklarına şaşırmalıyız. Başka bir şey yapmak için tasarlanmamışlardı, bu yüzden diğer şeyler bir bonus; ayrıca fazladan herhangi bir kabiliyet, sistemin eğitildiği metinde dolaylı yoldan anlaşılan bir şey olmalı.
[İlgili: Yapay zeka, yaratıcı düşünme testinde ilk %1’lik dilime giriyor]
Bu sebepler ve daha fazlası dolayısıyla, LLM teknolojisinin tek başına “gerçek yapay zekaya” giden bir güzergâh sunması bana muhtemel görünmüyor. Dünyamızda gerçek anlamda mevcut değiller ve bunun farkında da değiller. Bir LLM’yi konuşma ortasında bırakırsanız ve bir haftalığına tatile giderseniz, sizin nerede olduğunuzu merak etmeyecektir. Zamanın geçişinin farkında değildir ve aslında hiçbir şeyin farkında değildir. Siz bir istem yazana kadar, kelimenin tam anlamıyla hiçbir şey yapmayan ve sonrasında sadece o isteme bir yanıt hesaplayan, bu noktada da tekrar hiçbir şey yapmamaya geri dönen bir bilgisayar programıdır. Dünyaya dair ansiklopedik bilgileri eğitildikleri noktada kalmıştır. Ondan sonrasına dair bir şey bilmezler.
Ayrıca LLM’ler asla herhangi bir şey tecrübe etmemiştir. Sadece hayal edilemeyecek miktarlarda metin sindirmiş programlardır. LLM’ler sarhoş olmanın hissini tarif etmede harika bir iş çıkarabilir fakat bunun sebebi, sarhoş olmanın bir sürü tanımını okumuş olmalarıdır. Bunu kendi kendilerine yaşamamışlardır ve yaşayamazlar. Onlara verdiğiniz isteme karşı en iyi yanıtı oluşturmaktan başka hiçbir amaçları yoktur.
Bu durum etkileyici olmadıkları (ki öyleler) ya da kullanışlı olamayacakları (öyleler) anlamına gelmez. Ben aslında gerçekten teknolojide bir dönüm noktasında olduğumuza inanıyorum. Fakat bu hakiki başarıları “gerçek yapay zeka” ile karıştırmayalım. LLM’ler gerçek yapay zekanın formülündeki bir bileşen olabilir ama kesinlikle formülün bütünü değiller; ve ben diğer bazı bileşenlerin ne olduğunu henüz bilmediğimizden kuşkulanıyorum.
Yazar: Michael Wooldridge/Big Think. Çeviren: Ozan Zaloğlu.