Çin’in Google’ı Baidu Saniyeler İçerisinde Sesleri Klonlayabilen Bir Yapay Zekâ Geliştirdi

Çin’de Google’ın eşdeğeri niteliğindeki Baidu’nun yapay zekâ araştırma takımı, birkaç saniye uzunluğundaki ses örneklerini dinleyerek bu sesleri kopyalayabilen bir nöral ağ geliştirdi.  Bu yazılım aynı zamanda bu seslerde cinsiyet ve aksan değişikliği de yapabiliyor.

Siz uzaktayken çocuğunuza uyumadan önce kendi sesinizle kitap okutabildiğinizi hayal edebiliyor musunuz? Ya da konuşma yetisini kaybetmiş bir kişinin, kendi sesini kullanan bir sesli asistana sahip olduğunu? Bunları yapabilmek için artık sadece saniyeler yeterli olacak gibi görünüyor.

Çin’de Google’ın eşdeğeri niteliğindeki Baidu, sadece birkaç saniye uzunluktaki ses örneklerini dinleyerek bunları kopyalayabilen bir yazılım geliştirdi. Bu yazılım aynı zamanda sesleri farklı cinsiyetlere ya da aksanlara da dönüştürebiliyor.

Örnekleri buradan dinleyebilirsiniz.

Benzerlerinden Çok Daha Başarılı

Adobe’un VoCo isimli programı 20 dakikalık ses dosyası materyalini kullanarak aynı işlemi yapabiliyordu. Kanadalı bir startup ise bu süreyi bir dakikaya kadar düşürmeyi başarmıştı. Fakat Baidu, yeni çalışmasıyla benzerlerinden açık ara farkla öne geçmiş durumda.

Kaynak: Futurism

 

Posted by Derya Öztürk

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir