Metinden sese dönüştürme süreci günümüzde çok da ileri düzeylerde değil. Çünkü konuşmadaki duraksamalar ve vurgular bir bilgisayar yardımıyla oluşturulduğunu kolayca anlamamızı sağlıyor. Fakat Microsoft‘un geliştirdiği yeni bir yapay zeka teknolojisiyle, insan konuşmasına çok yakın bir dönüştürme süreci yapılabilecek.
Yüzde 99.84 anlaşılabilirlik oranı
Microsoft ve Çinli araştırmacılar tarafından geliştirilen bu yapay zeka, 200 ses örneğine dayanarak gerçekli konuşmalar yaratabiliyor. Geliştirilen bu yeni teknoloji, beyindeki nöronları taklit eden derin nöral ağlara dayanıyor. Transformers olarak da isimlendirilen bu nöral ağlar, her girdi ve çıktıyı tahlil ederek, çok uzun dizileri bile verimli bir halde işleyebiliyor.
Sonucun hafif bir robotik sesle alındığı bu teknolojide, yüzde 99.84’lük bir söz anlaşılabilirliği oranı yakalanıyor. En kıymetlisi ise bu konuşmanın, başka dönüştürme süreçlerine göre son derece gerçekçi olması. Microsoft, geliştirdiği bu yapay zeka ile yakın bir vakitte daha da gerçekçi diyaloglar oluşturulabileceğini de belirtiyor.