
Üretken yapay zeka yarışı
Şimdiye kadar teknoloji haberlerinin en sıradan takipçileri bile ChatGPT, Stable Diffusion, Midjourney ve DALL-E üzere üretken yapay zeka araçlarından haberdardır. Dünyanın en büyük 5 şirketi en düzgün büyük lisan modellerini geliştirmek ve bunları kullandığımız her yazılım yahut web hizmetine dahil etmek için yarışıyor. Bu araçlar, istemleri kullanarak faydalı imajlar yahut metinler üretebiliyor. Öte yandan bu araçların birden fazla beşerler tarafından yazılan eserler üzerinde “eğitiliyor” ve çıktılarını manalı bir seviyeye çıkarmak için insan nezareti gerektiriyor.
DragGAN ile görsel düzenlemede devrim
Bununla birlikte, yapılan yeni yapay zeka araştırması, bilhassa manzara manipülasyonu alanındaki inanılmaz ilerlemeyi gözler önüne seriyor. Google, MIT, Pennsylvania Üniversitesi ve Almanya’daki Max Planck Bilişim Enstitüsü‘nden bir küme bilim insanı, manzara düzenlemeyi sıradan beşerler için daha kolay ve erişilebilir hale getirebilecek deneysel bir araç geliştirdi.
DragGAN olarak isimlendirilen yeni aracın neler yapabildiğini anlamak için yalnızca bu haber içindeki örneklere bakmak kâfi. Yalnızca birkaç tıklama ve birkaç saniye ile görselde bulunan nesneyi 3D modelmiş üzere döndürmek, yüz tabirlerini değiştirmek yahut aklınıza gelebilecek öteki zorlu düzenlemeleri yapmak mümkün. Bu ortada DragGAN’ın halka açık bir model olmadığını da belirtelim. Münasebetiyle aracı deneme imkanımız olmadı.
Hayalinizdeki sahne yalnızca birkaç saniye uzakta
Araştırmacılar, DragGAN’ın Nvidia’nın GeForce RTX 3090 grafik kartı kullanıldığında bir imajın içeriğini yalnızca birkaç saniye içinde değiştirebileceğini, zira uygulamalarının istenen sonuçları elde etmek için birden fazla hudut ağı kullanmasına gerek olmadığını belirtiyor. Bir sonraki adım, 3D modellerin nokta tabanlı düzenlenmesi için misal bir model geliştirmek olacak.
