İhtilalin eşiğindeyiz: Meta’nın yapay zekası insanları kandırarak oyunu kazanıyor

by Aybike Güzel
0 comment
Meta AI, stratejik masa oyunu Diplomacy’de insan düzeyinde performans elde eden birinci yapay zeka olduğunu sav ettiği Cicero‘nun geliştirildiğini duyurdu. Temelinde bu kayda paha ve üstünde durulması gereken bir muvaffakiyet çünkü Diplomacy, başka oyunlar üzere yüzeysel değil derin, kişilerarası bağlantı maharetleri gerektiriyor.

Deep Blue, 1997’de satrançta Garry Kasparov’u yenmeden evvel bile, masa oyunları yapay zekaların muvaffakiyetlerinin temel bir ölçüsüydü. 2015’te AlphaGo, Go ustası Lee Sedol’u yendiğinde öbür bir mani daha aşılmıştı. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisine sahip ve mümkünlük temelli yaklaşımlar, bu oyunların temelinde yatıyor.

Cicero, Diplomacy’de insan düzeyinde performans sergiliyor

Lakin Diplomacy oyununda ise oyunun temel zorlayıcı kısmı gelişmiş toplumsal marifet yetenekleri talep etmesi. Oyuncular kazanmak için empati göstermeli, doğal bir lisan kullanmalı ve ilişkiler kurarak ilerlemeli. Bunu akılda tutarak Meta, “İnsanların yaptığına benzeri stratejik maksatlara ulaşmak için beşerlerle bağlantı kurarak ikna etmek ve onlarla birlikte çalışmak için lisanı kullanabilen daha tesirli ve esnek ortacılar oluşturabilir miyiz?” diye sordu. Meta’ya nazaran yanıt evet.

Geliştirilen Cicero yapay zekası, webDiplomacy.net‘te Diplomacy’nin çevrimiçi bir sürümünü oynayarak eğitildi. Cicero vakit içerisinde oyunda ustalaşarak insan oyuncuların “ortalama puanının iki katından fazlasını” elde etmeyi başardı.

Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal lisan işleme (GPT-3’e benzer) için yapay zeka modellerini bir ortaya getirdi ve bunları tek bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumunu, sohbet geçmişlerini ve başka oyuncuların nasıl davranacağını tahlil ederek ilerliyor. Cicero insan gibisi diyaloglar oluşturabildiği için öteki oyuncularla koordineli bir halde çalışabilir ve planını uyguluyor.

Meta, Cicero’nun doğal lisan hünerlerini, “kontrol edilebilir bir diyalog modeli” olarak tanımlıyor. GPT-3 üzere, Cicero da web’den elde edilen kütüphaneleri kullanıyor. Meta, Cicero’nun eğitimine 2,7 milyar parametreli BART gibisi bir lisan modeliyle başladıklarını da belirtiyor.

Cicero, strateji içinde strateji geliştiriyor

Meta araştırmacılarının belirttiği üzere Cicero’nun yetenekleri ve stratejileri oldukça ayrıntılı. Aktarılanlara nazaran Cicero, oyunun ilerleyen kısımlarında muhakkak bir oyuncunun takviyesine gereksinim duyacağını anlayabiliyor ve o kişinin gözüne girmek için başka bir strateji oluşturuyor. Hatta o oyuncunun karşılaşabileceği riskleri ve fırsatları da fark edip konum alabiliyor.

Cicero’nun geleceği âlâ de olabilir makus de

Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının beşerler ortasındaki “iletişim manilerini hafifletebileceğini” öne sürüyor. Yahut eğitim alanlarında hatta oyunlardaki daha gerçekçi NPC’ler için kullanılabileceği belirtiliyor. Bu sayede oyuncunun motivasyonuna ahenk sağlanabilir.

Aynı vakitte bu teknoloji, insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, öbür araştırmacıların kendi kodunu “sorumlu bir şekilde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor. Meta’nın buradaki “adımlar”dan kastı muhtemelen internet metinlerinden öğrenilen diyaloglar. Büyük lisan modellerini internet bilgi tabanıyla oluşturmak bu üzere olumsuz riskleri içeriyor. Son olarak Meta’nın Cicero’nun nasıl çalıştığını açıklamak için bir web sitesi yayına aldı ve ayrıyeten Cicero’nun kodunu GitHub‘da açık kaynaklı hale getirdi.

You may also like

Leave a Comment