Yeni yapay zeka aracı DragGAN, manzara düzenlemede ihtilal yaratıyor

by Aybike Güzel
0 comment
Deneysel yapay zeka aracı, kolay bir tıklama ve sürükleme hareketiyle görselleri düzenlemeyi (edit) çocuk oyuncağı haline getiriyor. DragGAN olarak isimlendirilen üretken yapay zeka aracı, yalnızca saniyeler içerisinde imgelerde radikal değişiklikler yapmanızı sağlıyor. DragGAN’ı Photoshop’un Warp aracı üzere lakin çok daha güçlüsü olarak düşünebilirsiniz.

Üretken yapay zeka yarışı

Şimdiye kadar teknoloji haberlerinin en sıradan takipçileri bile ChatGPT, Stable Diffusion, Midjourney ve DALL-E üzere üretken yapay zeka araçlarından haberdardır. Dünyanın en büyük 5 şirketi en düzgün büyük lisan modellerini geliştirmek ve bunları kullandığımız her yazılım yahut web hizmetine dahil etmek için yarışıyor. Bu araçlar, istemleri kullanarak faydalı imajlar yahut metinler üretebiliyor. Öte yandan bu araçların birden fazla beşerler tarafından yazılan eserler üzerinde “eğitiliyor” ve çıktılarını manalı bir seviyeye çıkarmak için insan nezareti gerektiriyor.

DragGAN ile görsel düzenlemede devrim

Bununla birlikte, yapılan yeni yapay zeka araştırması, bilhassa manzara manipülasyonu alanındaki inanılmaz ilerlemeyi gözler önüne seriyor. Google, MIT, Pennsylvania Üniversitesi ve Almanya’daki Max Planck Bilişim Enstitüsü‘nden bir küme bilim insanı, manzara düzenlemeyi sıradan beşerler için daha kolay ve erişilebilir hale getirebilecek deneysel bir araç geliştirdi.

DragGAN olarak isimlendirilen yeni aracın neler yapabildiğini anlamak için yalnızca bu haber içindeki örneklere bakmak kâfi. Yalnızca birkaç tıklama ve birkaç saniye ile görselde bulunan nesneyi 3D modelmiş üzere döndürmek, yüz tabirlerini değiştirmek yahut aklınıza gelebilecek öteki zorlu düzenlemeleri yapmak mümkün. Bu ortada DragGAN’ın halka açık bir model olmadığını da belirtelim. Münasebetiyle aracı deneme imkanımız olmadı.

Hayalinizdeki sahne yalnızca birkaç saniye uzakta

Araştırmacılar, DragGAN’ın Nvidia’nın GeForce RTX 3090 grafik kartı kullanıldığında bir imajın içeriğini yalnızca birkaç saniye içinde değiştirebileceğini, zira uygulamalarının istenen sonuçları elde etmek için birden fazla hudut ağı kullanmasına gerek olmadığını belirtiyor. Bir sonraki adım, 3D modellerin nokta tabanlı düzenlenmesi için misal bir model geliştirmek olacak.

Lakin ilgili araştırma grubunun de belirttiği üzere bu çalışmanın asıl enteresan yanı imaj manipülasyonu değil, kullanıcı arayüzü. Bir müddettir gerçekçi imajlar oluşturmak için GAN’lar üzere yapay zeka araçlarını kullanabiliyoruz, lakin birçok metot esneklik ve hassasiyetten mahrum. Bir yapay zeka imaj üreticisine “savanada sinsice ilerleyen bir aslan resmi yap” dediğinizde bir tane elde edersiniz, fakat bu tam olarak istediğiniz yahut muhtaçlık duyduğunuz poz olmayabilir. Hatta bu istemlerden azamî randımanı elde etmek için AI Prompt mühendisliği bile türedi ve yılda 300 bin dolardan fazla kazanabiliyor. DragGAN, bu ayrıntılı istemlere gerek duymadan hayalinizdeki sahneyi oluşturabilmenizi mümkün kılıyor.

You may also like

Leave a Comment