Yeni yapay zeka aracı DragGAN, görüntü düzenlemede devrim yaratıyor

Deneysel yapay zeka aracı, basit bir tıklama ve sürükleme hareketiyle görselleri düzenlemeyi (edit) çocuk oyuncağı haline getiriyor. DragGAN olarak adlandırılan üretken yapay zeka aracı, sadece saniyeler içerisinde görüntülerde radikal değişiklikler yapmanızı sağlıyor. DragGAN’ı Photoshop’un Warp aracı gibi ancak çok daha güçlüsü olarak düşünebilirsiniz.

Üretken yapay zeka yarışı

Şimdiye kadar teknoloji haberlerinin en sıradan takipçileri bile ChatGPT, Stable Diffusion, Midjourney ve DALL-E gibi üretken yapay zeka araçlarından haberdardır. Dünyanın en büyük 5 şirketi en iyi büyük dil modellerini geliştirmek ve bunları kullandığımız her yazılım veya web hizmetine dahil etmek için yarışıyor. Bu araçlar, istemleri kullanarak yararlı görüntüler veya metinler üretebiliyor. Öte yandan bu araçların çoğu insanlar tarafından yazılan eserler üzerinde “eğitiliyor” ve çıktılarını anlamlı bir düzeye çıkarmak için insan gözetimi gerektiriyor.

DragGAN ile görsel düzenlemede devrim

Bununla birlikte, yapılan yeni yapay zeka araştırması, özellikle görüntü manipülasyonu alanındaki inanılmaz ilerlemeyi gözler önüne seriyor. Google, MIT, Pennsylvania Üniversitesi ve Almanya’daki Max Planck Bilişim Enstitüsü‘nden bir grup bilim insanı, görüntü düzenlemeyi sıradan insanlar için daha kolay ve erişilebilir hale getirebilecek deneysel bir araç geliştirdi.

DragGAN olarak adlandırılan yeni aracın neler yapabildiğini anlamak için sadece bu haber içindeki örneklere bakmak yeterli. Sadece birkaç tıklama ve birkaç saniye ile görselde bulunan objeyi 3D modelmiş gibi döndürmek, yüz ifadelerini değiştirmek veya aklınıza gelebilecek diğer zorlu düzenlemeleri yapmak mümkün. Bu arada DragGAN’ın halka açık bir model olmadığını da belirtelim. Dolayısıyla aracı deneme imkanımız olmadı.

Hayalinizdeki sahne sadece birkaç saniye uzakta

Araştırmacılar, DragGAN’ın Nvidia’nın GeForce RTX 3090 grafik kartı kullanıldığında bir görüntünün içeriğini sadece birkaç saniye içinde değiştirebileceğini, çünkü uygulamalarının istenen sonuçları elde etmek için birden fazla sinir ağı kullanmasına gerek olmadığını belirtiyor. Bir sonraki adım, 3D modellerin nokta tabanlı düzenlenmesi için benzer bir model geliştirmek olacak.

Ancak ilgili araştırma ekibinin de belirttiği gibi bu çalışmanın asıl ilginç yanı görüntü manipülasyonu değil, kullanıcı arayüzü. Bir süredir gerçekçi görüntüler oluşturmak için GAN’lar gibi yapay zeka araçlarını kullanabiliyoruz, ancak çoğu yöntem esneklik ve hassasiyetten yoksun. Bir yapay zeka görüntü üreticisine “savanada sinsice ilerleyen bir aslan resmi yap” dediğinizde bir tane elde edersiniz, ancak bu tam olarak istediğiniz veya ihtiyaç duyduğunuz poz olmayabilir. Hatta bu istemlerden maksimum verimi elde etmek için AI Prompt mühendisliği bile türedi ve yılda 300 bin dolardan fazla kazanabiliyor. DragGAN, bu detaylı istemlere gerek duymadan hayalinizdeki sahneyi oluşturabilmenizi mümkün kılıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*