Kyutai isimli araştırma laboratuvarı Moshi isimli yapay zekayı tanıttı ve oldukça ses getirdi. Açık kaynaklı olan proje, GPT-4o ve Google Astra’nın yeni rakibi olarak görülüyor. İşte detaylar…
Kar amacı gütmeyen Fransız araştırma laboratuvarı Kyutai’nin açıklamasına göre Moshi, 70 farklı duygu ve tarzı anlayıp ifade edebiliyor. Aynı anda hem dinleyip hem de konuşabiliyor. Özetle iki farklı ses akışını idare ediyor. Bununla birlikte farklı aksanlarla da konuşabiliyor. Tanıtımda sahne alan Neil Zeghidour, yapay zekanın Fransızca aksanlı İngilizce konuşmasını istediğinde, Moshi aksanını değiştirip konuşmaya başladı.
Moshi and Neil on stage giving some emotional improv. pic.twitter.com/yVLGpTZkYJ
— kyutai (@kyutai_labs) July 3, 2024
Temel özellikleri şu şekilde:
-Helium 7B modeli üzerinde geliştirildi
-200 milisaniye gecikme
-MacBook’lar dahil olmak üzere farklı platformlarda çalışabiliyor
-Birden fazla backend desteği var (CUDA, Metal, CPU)
-Yapay zeka tarafından oluşturulan seslerin tespiti için filigranlama yapabiliyor
Kyutai başkanı Patrick Pérez yaptığı açıklamada geliştirdikleri yapay zekanın devrim yapabilecek potansiyele sahip olduğunu belirterek, “Konuşurken düşünüyor” dedi. Bununla birlikte Kyutai, tüm kodları, 7B modelini, ses codec’lerini vs… özetle modelin tamamına ait her şeyi yayınlamayı planlıyor.
Bir girişim olan Kyutai Kasım 2023’te 300 milyon euroluk yatırımla kuruldu. Yatırımcılar arasında Fransız milyarder Xavier Niel de bulunuyor. Yapay zeka projesi 8 kişilik bir ekiple 6 ay içinde geliştirildi. Araştırma laboratuvarı yapay zeka alanındaki araştırmalara katkıda bulunmayı ve ekosistem gelişimini teşvik etmeyi amaçlıyor.
Moshi’nin demosunu denemek isterseniz buraya tıklayabilirsiniz.