Whisk: Google'ın Imagen 3 Tabanlı Yeni Yapay Zekâ Aracı

Yapay zekâ teknolojilerine yönelik hamlelerini hız kesmeden sürdüren Google, dün gece gerçekleştirdiği etkinlikte dikkat çeken yeni yapay zekâ modellerini duyurdu. Etkinliğin en önemli yeniliklerinden biri, OpenAI’ın video oluşturma aracı Sora’ya rakip olarak geliştirilen Veo 2 olurken, bir diğer dikkat çeken tanıtım ise görsel oluşturma aracı Whisk oldu.

Whisk, diğer görsel oluşturma araçlarından ayrılan bir özelliğe sahip: Metin komutlarına olan ihtiyacı minimuma indiriyor. Kullanıcılar, yalnızca görsel komutlar kullanarak yeni görseller oluşturabiliyor. Örneğin, belirli bir görselin ana ögesi, detayları ya da tarzı referans alınarak, yapay zekâ destekli yeni tasarımlar elde edilebiliyor. Üstelik bu süreçte tek bir görsel kullanma zorunluluğu da bulunmuyor. Birden fazla görselin bir araya getirilmesiyle istenilen sonucu elde etmek mümkün.

Google, Whisk ile metin ve görsel komutları bir arada sunuyor.

Google, Whisk’i daha esnek hale getirerek metin komutlarının kullanımını tamamen ortadan kaldırmamış durumda. Kullanıcılar, ihtiyaç duyduklarında metin yoluyla detaylı eklemeler yapabiliyor ya da uygun görsel referansları bulunmadığında metin komutlarından faydalanabiliyor. Böylece Whisk, görsel ve metin komutlarının bir arada kullanılabildiği hibrit bir model sunuyor.

Google’ın Whisk aracının temelinde Imagen 3 modeli bulunuyor.

Google’ın açıklamasına göre Whisk, fotogerçekçi görseller oluşturmaktan ziyade farklı tasarım stillerine hitap eden, yaratıcı sonuçlar sunmak için tasarlandı. Kullanıcılar, oluşturulan görseller arasından beğendiklerini seçip indirebiliyor ya da metin komutları aracılığıyla görsel üzerinde değişiklikler yapabiliyor. Whisk’in arkasında, Google’ın en yeni görsel oluşturma modeli olan Imagen 3 bulunuyor. Ancak model şu anda sınırlı erişimle kullanıma sunulmuş durumda ve ülkemiz dahil birçok bölgede erişilebilir değil.

Kaynak: WebTekno