Google AI Artık Kalabalık İçindeki İstediği Bir Kişiye Odaklanarak Yalnızca Onu Duyabiliyor

Google’ın yapay zekası, gürültülü bir ortam içerisindeki istediği bir kişinin konuşmasını, o kişinin yüzüne odaklanarak diğer seslerden ayırabilmeyi öğrendi. Bu yeteneğin, işitme cihazlarında ve görüntülü sohbetlerde ses kalitesini önemli ölçüde arttırabileceği belirtiliyor.

Biz insanlar kalabalık bir ortamda, odaklandığımız kişinin sesini daha net duyabilme özelliğine sahibiz. Makinelerinse bunu yapabilecek yetileri yok-tu.

Google araştırmacıları geliştirdikleri derin öğrenme sistemine, insanlar konuşurken onların yüzlerine odaklanarak seslerini kalabalık içinden izole edebilmeyi öğrettiler. Ortam seslerini istediği ölçüde azaltıp arttırabilme özelliğine de sahip olduğunu düşünecek olursak bunu insanlardan çok çok daha başarılı bir şekilde yapabildiğini söyleyebiliriz.

Aşağıdaki videoda yapay zekanın, iki komedyenin aynı anda konuşarak gerçekleştirdikleri bir stand-up gösterisinde sesleri birbirinden nasıl ayırt ettiğini izleyebilirsiniz:

Kaynak: Google Research Blog

 

Posted by Derya Öztürk

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir