Meta'dan ses klonlayan yapay zeka: Voicebox

Meta, sadece 2 saniyelik bir ses kaydından ses klonlayan yapay zekasını tanıttı. Sesin yanı sıra konuşma tarzını da taklit eden "Voicebox" isimli yapay zeka, farklı dillerde seslendirme yapabiliyor.

Reklam
Reklam

Yapay zeka teknolojilerinin gelişimiyle bir sesi klonlamak ve bu sesle cümleler söyletmek mümkün hale gelmişti. ElevenLabs ve Uberduck gibi platformlar bu konuda zirvede bulunurken bugün Meta’dan sürpriz bir hamle geldi.

Meta, yapay zeka ile konuşmalar üretilmesini sağlayan yeni “Voicebox” isimli yapay zekasını duyurdu. Voicebox, tıpkı az önce bahsettiklerimiz gibi sesinizi klonlamanızı, bu ses ile yazdığınız metni seslendirmenizi sağlıyor. Elbette asıl olay, metnin seslendirilmesinin tıpkı bir insan gibi yapılmasında yatıyor.

Voicebox ile konuşma tarzı klonlama
Meta’nın “konuşmada üretken yapay zekalar için çığır açan buluş” olarak paylaştığı Voicebox, sadece ses taklit etme ve yazılanı okumak gibi fonksiyonlara sahip olmayacak. Yapay zeka, bundan farklı dillerde konuşmanızı sağlamak dahil çok daha fazlasını yapacak.

Voicebox, sesin içeriğini ve stilini korurken yüksek kaliteli ses klipleri üretebilir ve araba kornalarını veya köpek havlamasını kaldırmak gibi önceden kaydedilmiş sesleri düzenleyebilir. Model aynı zamanda çok dillidir ve altı dilde konuşma üretebilir.

Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca veya Portekizce olarak bir içeriği seslendirebilecek. Üstelik farklı dillerde seslendirme için o dilde yazı veya ses sunmanız gerekmeyecek. Yapay zeka, Fransızca bir sesi veya metni İngilizce veya diğer tüm desteklenen dillere çevirebilecek.

Sadece 2 saniyede ses klonlanabilecek
Günümüz ses klonlama platformları, klonlama işlemi için en az 5 dakikalık kayıtlar isterken Meta bu konuda gerçekten çığır açmayı başardı. Şirket, Voicebox’ın sadece 2 saniyelik bir kayıtla ses stilini öğrenebildiğini ve bu stili seslendirmeye aktarabildiğini ifade etti.

Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış telaffuz ettiğiniz kelimeler, Voicebox ile yapay zeka aracılığıyla sonradan düzenlenebilecek. Şirket, Voicebox hakkındaki araştırma makalesini yayınladı. Ayrıca kullanıcıların yapay zekanın ilk seslerini duyabilecekleri demo sayfasını da yayınladı. Ancak yapay zeka, kötüye kullanım ihtimalleri nedeniyle henüz kullanıma sunulmadı. Şimdilik yalnızca bilimsel çalışmalara açık olacak. 

Kaynak: Webtekno