Yazılı dili modellemek için geliştirilen yapay zeka, insanların hayatlarındaki olayları tahmin etmede kullanılabilir. Danimarka Teknik Üniversitesi (DTU), Kopenhag Üniversitesi, Danimarka Bilgi Teknolojileri Üniversitesi ve Northeastern Üniversitesinde çalışan bilim insanlarının yürüttüğü bir araştırma projesi, insanların hayatlarıyla ilgili büyük miktarlarda veri kullanmanız ve ChatGPT gibi dili işlemede kullanılan ‘dönüştürücü modeller’i eğitmeniz durumunda, yapay zekanın bu verileri sistematik şekilde düzenleyebileceği ve bir insanın hayatında neler olacağını; hatta ölüm tarihini bile tahmin edebileceğini gösteriyor.
Nature Computational Science bilim bülteninde yayımlanan ve ‘İnsanların Hayatlarını Tahmin Etmek için Yaşamdaki Olay Dizilerinin Kullanılması’ başlığını taşıyan yeni bir bilimsel makalede araştırmacılar, life2vec adlı bir modelde bütün Danimarkalıların sağlık verilerini ve iş piyasasıyla olan bağlantılarını analiz etmiş. Modelin başlangıç aşamasında eğitildikten ve verideki örüntüleri öğrendikten sonra, diğer gelişmiş sinirsel ağlardan daha iyi performans sergilediği ve kişilik ile ölüm tarihi gibi sonuçları yüksek isabetle tahmin ettiği gösterilmiş.
DTU’da çalışan ve makalenin birinci yazarı olan Profesör Sune Lehmann şöyle aktarıyor: “Modeli kullanarak temel bir soruyu ele aldık: ‘Geçmişinizdeki durumlar ve olaylara dayalı olarak, geleceğinizdeki olayları ne dereceye kadar tahmin edebiliriz?’ sorusunu. Bilimsel olarak bizi heyecanlandıran şey yapılan tahminin kendisi olmaktan ziyade, modelin böylesine kesin cevaplar sunmasını sağlayan veri özellikleriydi.”
Ölüm tarihine dair tahminler
Life2vec’in yaptığı tahminler, ‘Dört yıl içerisinde ölüm?’ gibi genel sorulara yönelik yanıtlardan oluşuyor. Araştırmacılar modelin yanıtlarını analiz ettiklerinde, karşılaştıkları sonuçlar beşeri bilimlerdeki mevcut bulgularla tutarlı olmuş. Örneğin her şeyin eşit olduğu bir durumda, liderlik konumundaki bireylerin veya yüksek gelirli bireylerin hayatta kalması daha muhtemelken kişinin erkek olması, kalifiye olması veya zihinsel bir teşhisinin bulunması daha yüksek bir ölüm tehlikesiyle ilişkilendirilmiş. Life2vec, farklı verileri düzenleyen matematiksel bir yapı olan büyük bir vektör sistemindeki verileri kodluyor. Model doğum tarihi, eğitim ve öğretim, maaş, konut ve sağlık gibi alanlarda nereye veri yerleştirileceğine karar veriyor.
“Bir dildeki bir cümle nasıl bir dizi kelimeden oluşuyorsa, insan hayıtını da bu şekilde uzun bir olaylar dizisi şeklinde düşünmek heyecan verici” diyor Sune Lehmann. “Bu genelde yapay zekadaki dönüştürücü modellerin kullanıldığı türden bir iş. Fakat biz deneylerimizde bunları, yaşam dizileri şeklinde adlandırdığımız şeyleri; ör. insan hayatında gerçekleşen olayları analiz etmek için kullandık.”
Etik soruların ortaya çıkışı
Makalenin ardındaki araştırmacılar life2vec’in etrafında, hassas veriler ve özel hayatın gizliliğinin korunması ve verilerdeki önyargıların rolü gibi etik soruların bulunduğunu belirtiyor. Örneğin bir kişinin hastalık kapmaya veya diğer önlenebilir yaşam olaylarına dönük taşıdığı tehlikeyi değerlendirmede modelin kullanılabilmesinden önce bu problemlerin daha derin şekilde anlaşılması gerekiyor.
“Model, tartışmaya ve politik olarak ele alınmaya yönelik önemli olumlu ve olumsuz yönleri ortaya çıkarıyor. Yaşam olaylarını ve insan davranışlarını tahmin etmeye dönük benzer teknolojiler, günümüzde halihazırda teknoloji şirketleri içerisinde kullanılıyor. Örneğin sosyal ağlardaki davranışlarımızı takip ediyor, son derece isabetli profilimizi çıkarıyor ve bu profilleri davranışlarımızı tahmin edip bizi etkilemek için kullanıyorlar. Bu tartışmanın, demokratik söyleşilerin parçası olması gerekiyor ki teknolojinin bizi nereye götürdüğünü ve bunun istediğimiz gelişme olup olmadığını düşünelim” diyor Sune Lehmann.
Araştırmacılara göre sıradaki adım, sosyal bağlantılarımızla ilgili metin, görüntü veya bilgiler gibi diğer bilgi tiplerini dahil etmek olacak. Bu veri kullanımı, sosyal bilimler ve sağlık bilimleri arasında yepyeni bir kesişimi ortaya çıkarıyor.
Araştırma projesi
Yeni çalışma, işgücü piyasası verileri ve Danimarka Milli Sağlık Kayıt (LPR) ve İstatistikleri projesinden alınan verilere dayanıyor. Veri seti 6 milyon Danimarkalının tamamını kapsıyor ve gelir, maaş, burs, iş tipi, endüstri, sosyal faydalar gibi alanlardaki bilgileri içeriyor. Sağlık veri setinde, sağlık uzmanlarına veya hastanelere yapılan ziyaretlerin, teşhislerin, hasta tipi ve aciliyet derecesinin kayıtları yer alıyor. Veri seti 2008’den 2020’ye kadar uzanıyor ancak bazı analizlerde araştırmacılar 2008-2016 dönemine ve yaş kısıtlı bir alt birey kümesine odaklanmış.
Dönüştürücü model
Dönüştürücü model bir yapay zeka, dil ve diğer görevlerle ilgili bilgi öğrenmede kullanılan derin öğrenim veri mimarisidir. Bu modeller dili anlamak ve oluşturmak için eğitilebiliyor. Dönüştürücü model, önceki modellerden daha hızlı, daha verimli olması için tasarlanmış ve genelde büyük dil modellerini büyük veri dizilerinde eğitmede kullanılıyor.
Yapay sinir ağları
Bir yapay sinir ağı, insanların ve hayvanların beyin ve sinir sisteminden ilham alınmış bir bilgisayar modelidir. Pek çok farklı tipte yapay sinir ağı mevcut (ör. dönüştürücü modeller). Bir yapay sinir ağı, beyin gibi yapay sinirlerden oluşur. Bu sinirler birbirine bağlanıp sinyal gönderebilir. Her bir sinir, diğer sinirlerden girdi alır ve sonrasında diğer sinirlere gönderilen bir çıktı hesaplar. Bir yapay sinir ağı, büyük miktarlarda veriyle eğitilerek problem çözmeyi öğrenebilir. Yapay sinir ağları öğrenmek için eğitim verisine bel bağlar ve doğrulukları zamanla artar. Fakat bu öğrenme algoritmaları doğruluk için ayarlandıklarında, bilgisayar bilimi ve yapay zekada verileri yüksek hızlarda sınıflandırıp gruplandırmak için güçlü araçlar haline gelirler. En iyi bilinen sinir ağlarından birisi de Google’ın arama algoritmasıdır.
Kaynak: Danimarka Teknik Üniversitesi. Çeviren: Ozan Zaloğlu.