
Deep Blue, 1997’de satrançta Garry Kasparov’u yenmeden evvel bile, masa oyunları yapay zekaların muvaffakiyetlerinin temel bir ölçüsüydü. 2015’te AlphaGo, Go ustası Lee Sedol’u yendiğinde öbür bir mani daha aşılmıştı. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisine sahip ve mümkünlük temelli yaklaşımlar, bu oyunların temelinde yatıyor.
Cicero, Diplomacy’de insan düzeyinde performans sergiliyor

Geliştirilen Cicero yapay zekası, webDiplomacy.net‘te Diplomacy’nin çevrimiçi bir sürümünü oynayarak eğitildi. Cicero vakit içerisinde oyunda ustalaşarak insan oyuncuların “ortalama puanının iki katından fazlasını” elde etmeyi başardı.
Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal lisan işleme (GPT-3’e benzer) için yapay zeka modellerini bir ortaya getirdi ve bunları tek bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumunu, sohbet geçmişlerini ve başka oyuncuların nasıl davranacağını tahlil ederek ilerliyor. Cicero insan gibisi diyaloglar oluşturabildiği için öteki oyuncularla koordineli bir halde çalışabilir ve planını uyguluyor.
Meta, Cicero’nun doğal lisan hünerlerini, “kontrol edilebilir bir diyalog modeli” olarak tanımlıyor. GPT-3 üzere, Cicero da web’den elde edilen kütüphaneleri kullanıyor. Meta, Cicero’nun eğitimine 2,7 milyar parametreli BART gibisi bir lisan modeliyle başladıklarını da belirtiyor.
Cicero, strateji içinde strateji geliştiriyor
Meta araştırmacılarının belirttiği üzere Cicero’nun yetenekleri ve stratejileri oldukça ayrıntılı. Aktarılanlara nazaran Cicero, oyunun ilerleyen kısımlarında muhakkak bir oyuncunun takviyesine gereksinim duyacağını anlayabiliyor ve o kişinin gözüne girmek için başka bir strateji oluşturuyor. Hatta o oyuncunun karşılaşabileceği riskleri ve fırsatları da fark edip konum alabiliyor.
Cicero’nun geleceği âlâ de olabilir makus de
Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının beşerler ortasındaki “iletişim manilerini hafifletebileceğini” öne sürüyor. Yahut eğitim alanlarında hatta oyunlardaki daha gerçekçi NPC’ler için kullanılabileceği belirtiliyor. Bu sayede oyuncunun motivasyonuna ahenk sağlanabilir.
Aynı vakitte bu teknoloji, insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, öbür araştırmacıların kendi kodunu “sorumlu bir şekilde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor. Meta’nın buradaki “adımlar”dan kastı muhtemelen internet metinlerinden öğrenilen diyaloglar. Büyük lisan modellerini internet bilgi tabanıyla oluşturmak bu üzere olumsuz riskleri içeriyor. Son olarak Meta’nın Cicero’nun nasıl çalıştığını açıklamak için bir web sitesi yayına aldı ve ayrıyeten Cicero’nun kodunu GitHub‘da açık kaynaklı hale getirdi.