
4chan üyeleri, Emma Watson, Joe Rogan ve başka ünlü isimlerin ırkçı, transfobik ve şiddet içeren şeyler söyleyen sahte seslerini yapmak için ElevenLabs’i kullandı. Şirket kısa bir mühlet evvel Twitter’dan açıklama yaparak “ses klonlamanın berbata kullanılması olaylarının sayısında artış” yaşandığını ve ek güvenlik tedbirleri uygulayarak sorunu çözmeye çalıştıklarını bildirdi.
Ünlülerin oluşturulmuş uydurma sesleri ırkçı telaffuzlarda kullanıldı

Klipler zararsızdan şiddete, transfobikten homofobiye ve ırkçılığa kadar geniş bir yelpazede yer alıyor. Çok çeşitli klipleri içeren bir 4chan gönderisi, ElevenLabs’in beta sürümüne bir ilişki da içeriyordu, bu da ElevenLabs’ın yazılımının sesleri oluşturmak için kullanılmış olabileceğini düşündürüyor. ElevenLabs, resmi web sitesinde hem “konuşma sentezi” hem de “ses klonlama” özellikleri sunuyor. Ses klonlama için ElevenLabs, bir dakikadan daha uzun olan pak bir örnek kayıt ile ilgili sesin klonunu oluşturuyor.
İnternette gördüklerimize ve duyduklarımıza inanmak daha da zorlaşıyor
Belki de “deepfake” ses kliplerinin bu ortaya çıkışı sürpriz olmamalı, zira birkaç yıl evvel emsal bir fenomenin gerçekleştiğini gördük. Yapay zeka ve makine tahsilindeki gelişmeler ünlülerin uydurma görüntülerinin üretilmesinde kullanılmıştı.
Sahte görüntüler, düzmece sesler geçersiz mimikler derken internette gördüğümüz ve duyduğumuz şeyler giderek gerçeklikten uzaklaşıyor. Elbette bu teknolojiler bu hedefler için geliştirilmiyor. Örneğin ElevenLabs resmi web sitesinde, sesli haber bültenleri, sesli kitap okuma ve görüntü üzere maksat kullanım alanlarından bahsediyor. Geldiğimiz noktada ise akıllara Edgar Allan Poe’nun “Gördüklerinizin sırf yarısına inanın, duyduklarınızın hiçbirine.” söylemi geliyor.