Google, fotoğraflara can veren “VLOGGER” yapay zekasını tanıttı

Google araştırmacıları, insanların tek bir fotoğrafını kullanarak konuşan, el kol hareketi yapan ve hareket eden gerçekçi videolar üretebilen yeni bir yapay zeka sistemi geliştirdi. VLOGGER adı verilen teknoloji, şaşırtıcı derecede gerçekçi ...

Seher Alp 18 Mart 2024

Google VLOGGER, fotoğraflara can veriyor

Google VLOGGER yapay zeka modeli, girdi olarak bir kişinin fotoğrafını ve bir ses kaydını kullanarak ortaya son derece gerçekçi sonuçlar çıkartabiliyor. Model, kişinin sesiyle eşleşecek şekilde kelimeleri konuşturabiliyor ve buna karşılık gelen el ve yüz hareketlerini yapabilen videolar üretebiliyor. Elbette videolar mükemmel olmaktan uzak ancak hareketsiz görüntüleri canlandırma becerisinde önemli bir eşiğe ulaşıldığı görülüyor.

Google Research’ten Enric Corona liderliğindeki araştırmacılar, VLOGGER’da difüzyon modelleri adı verilen bir tür makine öğrenimi modelinden yararlandılar. Difüzyon modelleri son zamanlarda metin istemlerinden gerçekçi görüntüler üreten yapay zekalarda kullanılıyordu. Ekip, bu modelleri video alanına çekerek ve geniş bir veri kümesi üzerinde eğiterek fotoğraflara son derece ikna edici bir şekilde hayat verebilen bir yapay zeka sistemi oluşturmayı başardı.

Araştırmada yazarlar, VLOGGER’ın önceki yöntemlerin aksine her bir kişi için eğitim gerektirmediğini, yüz algılama ve kırpmaya dayanmadığını ve tüm görüntüyü tek seferde ürettiğini belirtiyor. MENTOR adı verilen ve 800.000’den fazla farklı kimlik ve 2.200 saatlik video üzerinde eğitilen VLOGGER, dublaj ve video düzenleme alanında potansiyel olarak kullanılabilir. Bu teknoloji aynı zamanda sanal gerçeklik ve oyunlar için fotogerçekçi avatarlar yaratmak için de kullanılabilir. Ayrıca daha ilgi çekici ve etkileyici yapay zeka destekli sanal asistanların ve sohbet robotlarının oluşturulmasına da olanak sağlayabilir.

İyi kullanım senaryolarıyla birlikte bu teknoloji, örneğin bir videodaki kişinin yerine başka birinin benzerinin yerleştirildiği deepfake’lerin oluşturulması gibi kötüye kullanım potansiyeline de sahip. Yapay zeka tarafından üretilen bu videolar daha gerçekçi ve daha kolay oluşturulur hale geldikçe, yanlış bilgilendirme ve dijital sahtecilikle ilgili zorluk daha büyük bir sorun olmaya başlıyor. Bu nedenden dolayı VLOGGER şimdilik sadece bir araştırma modeli olarak mevcut durumda.