Google Duplex Nedir? Nasıl Çalışır?

23.05.2018 / Emir Bora Turan

Google, 2018 I/O etkinliğinde kuaför randevusu ve restoran rezervasyonu yapabilen AI tabanlı, telefon üzerinden doğal etkileşime sahip Duplex’in tanıtımını yaptı. Google Duplex, bir asistan ancak diğer asistanlardan farklı sizin adınıza arama yaparak sürekli insanmış gibi tamamlayabiliyor.

Her şeyden önce belirtmemiz gereken bir konu, Google Duplex, insanı o kadar iyi taklit ediyor ki, ayırt etmek imkânsız ve bu da etik AI konularında ciddi tartışmalar başlattı. Google, arama başlangıcında veya sonunda bot olduğunu aradığı kişiye bildireceğini iletti. Madem bunu yapacak neden bu kadar gerçekçi tonlara ihtiyacımız var konuları devam ediyor. Biz çok heyecanlandık çünkü şu ana kadar hiçbir AI insan hatası ve tepkileri ile birleştirilmemişti ve gerçek bir kişiden ayırt edemiyoruz. Yani Turing testini sonunda geçmiş oluyoruz.

Şimdi bu sürecin detaylarına inelim.

  1. Sesi anlama ve içeriğe çevirme
  2. Doğal dil işleme algoritmalarıyla içeriği anlama
  3. Anlaşılan veri sonucunda sonraki adımı belirleme
  4. Sonuçları doğal dil çıkarım algoritmaları ile içeriğe dönüştürme
  5. Çıkan doğal dil sese sentezlenir

Google Duplex doğal diyalog

 

Burada bahsettiğimiz 5 farklı konuda ayrı ayrı makine öğrenmesi çalışmalarına dâhil edilir ve sistemin yeni durumlara karşı öğrenen ve cevap veren bir sistem haline gelmesi sağlanır.

Burada diğer sistemlere göre en büyük farkındalık, Alphabet’in Deep Mind NN çalışmaları arasında yer alan WaveNet. Bu teknoloji insan mimiklerini taklit edebiliyor ve bunu konuşmaya ekleyebiliyor.

Google Duplex entegrasyonu

Daha önce yazdığımız ve belirttiğimiz bot teknolojilerinde de olduğu gibi ilerleyen günlerde bizlerde kendi sistemlerimize benzer entegrasyonlar yapabileceğiz. Bu gibi teknolojileri görmek kendi yaptığımız işlerin de dijitalde olmasının önemini arttırıyor. İşleri çok kompleks hale getirmeden eğer konuşmayı aşağıdaki tablodaki yapıya dökecek olursak aslında bir çeşit küçük kararlar veriyor, birkaç tane verisi var ve o veriler ışığında randevulaşırken nasıl cevap vereceğine odaklanıyor.

https://www.furhatrobotics.com/wp2/wp-content/uploads/2018/05/ExampleInteraction.jpg

Google Duplex teknik anlama çıktısı

Google Duplex, bizi neden bu kadar etkiledi?

Tamamen insan gibi konuşması ve tepki vermesi, mm-hmmm gibi bekleme eslerini bile taklit ediyor ancak takibi sadece birkaç alanda örnekler görmüş olduk, bu heyecan verici ama daha fazla alanda bunu yakalayabilecekler mi bunu göreceğiz. Şimdilik kısıtlı domain/alan üzerinde bizi mükemmel taklit eden bir asistanımız var.

Google I/O 2018 den bir görüntü

Google Duplex demosunun bize gösterdiği şey, konuşma sentezindeki kalitenin ve doğallığın insanların algısı üzerindeki muazzam etkisidir. Yukarıdaki diyaloğu ele alır ve konuşma sentezini “standart” konuşma sentezi istemleriyle değiştirirseniz, neredeyse etkilendiğimizden şüpheliydik. İnsan doğasının hatası ve tepkisindeki kusurlar burada bizim mükemmelsizliğimizin mükemmelliğine hayran bıraktı. Umarız, bu teknolojiyi Sophia gibi insansı bir robot üzerinde dinlerken ve Boston Dynamics robotları gibi kaliteli fiziksel hareket yeteneğine sahip robotlarla entegre olarak ilerleyen zamanlarda inceleyebiliriz.

Yazan: Sinan TECER (Eczacıbaşı Bilişim)