Duyduğunuz şey gerçek olmayabilir: Yapay zeka ses aracı berbata kullanılmaya başlandı

by Aybike Güzel
0 comment
Yapay zeka tarafından üretilen ses teşebbüsleri internet trollerinin oyunu haline gelmesi yalnızca an sorunuydu. Eski Google ve Palantir çalışanları tarafından kurulan yapay zeka tabanlı konuşma teşebbüsü ElevenLabs’in beta sürümü makus kullanım ile gündemde.

4chan üyeleri, Emma Watson, Joe Rogan ve başka ünlü isimlerin ırkçı, transfobik ve şiddet içeren şeyler söyleyen sahte seslerini yapmak için ElevenLabs’i kullandı. Şirket kısa bir mühlet evvel Twitter’dan açıklama yaparak “ses klonlamanın berbata kullanılması olaylarının sayısında artış” yaşandığını ve ek güvenlik tedbirleri uygulayarak sorunu çözmeye çalıştıklarını bildirdi.

Ünlülerin oluşturulmuş uydurma sesleri ırkçı telaffuzlarda kullanıldı

4chan’a yüklenen klipler genel olarak ünlüleri bahis alıyor lakin oluşturulan seslerin yüksek kalitesi ve insanların bunları oluşturmadaki bariz kolaylığı göz önüne alındığında “deepfake” ses kliplerinin riskleri şimdi yolun başında. ElevenLabs’in beta aracını kullanarak oluşturulan ses kliplerinde ünlü oyuncu Emma Watson‘a birebir benzeyen oluşturulmuş bir ses Mein Kampf’tan (Kavgam) bir kısım okuyor. Bir öbür örnekte Ben Shapiro’ya çok benzeyen bir ses ırkçı kelamlar söylüyor. Öbür bir örnekte ise Rick & Morty’deki Rick Sanchez’in Morty’ye yönelik şiddet telaffuzları bulunuyor. (Rick & Morty’yi seslendiren Justin Roiland, yakın vakitte ağır aile içi şiddet ile suçlanmıştı)

Klipler zararsızdan şiddete, transfobikten homofobiye ve ırkçılığa kadar geniş bir yelpazede yer alıyor. Çok çeşitli klipleri içeren bir 4chan gönderisi, ElevenLabs’in beta sürümüne bir ilişki da içeriyordu, bu da ElevenLabs’ın yazılımının sesleri oluşturmak için kullanılmış olabileceğini düşündürüyor. ElevenLabs, resmi web sitesinde hem “konuşma sentezi” hem de “ses klonlama” özellikleri sunuyor. Ses klonlama için ElevenLabs, bir dakikadan daha uzun olan pak bir örnek kayıt ile ilgili sesin klonunu oluşturuyor.

İnternette gördüklerimize ve duyduklarımıza inanmak daha da zorlaşıyor

Belki de “deepfake” ses kliplerinin bu ortaya çıkışı sürpriz olmamalı, zira birkaç yıl evvel emsal bir fenomenin gerçekleştiğini gördük. Yapay zeka ve makine tahsilindeki gelişmeler ünlülerin uydurma görüntülerinin üretilmesinde kullanılmıştı.

Sahte görüntüler, düzmece sesler geçersiz mimikler derken internette gördüğümüz ve duyduğumuz şeyler giderek gerçeklikten uzaklaşıyor. Elbette bu teknolojiler bu hedefler için geliştirilmiyor. Örneğin ElevenLabs resmi web sitesinde, sesli haber bültenleri, sesli kitap okuma ve görüntü üzere maksat kullanım alanlarından bahsediyor. Geldiğimiz noktada ise akıllara Edgar Allan Poe’nun “Gördüklerinizin sırf yarısına inanın, duyduklarınızın hiçbirine.” söylemi geliyor.

You may also like

Leave a Comment