Google kısa süre önce çıkardığı Gemma 4 modeli için yepyeni bir hızlandırma teknolojisi duyurdu. Geliştirilen sistem sayesinde yapay zeka kalite kaybı yaşamadan eskisinden üç kat daha seri yanıt veriyor. İşte detaylar…
Google‘ın resmi açıklamasına göre Gemma 4 ailesi Multi-Token Prediction kısaca MTP adında bir sistem tarafından destekleniyor. Bu sistem arka planda Speculative Decoding adında özel bir mimariden güç alıyor. Böylece yapay zekanın mantık yürütme becerisinde veya verdiği cevapların doğruluğunda hiçbir bozulma yaşanmadan işlem süresi ciddi boyutlarda kısalıyor.

Standart yapay zeka modelleri normal şartlarda kelimeleri tek tek üreterek çalışır. Bu da vakit kaybına neden olur. Yeni sistem ise ağır işi üstlenen ana modelin yanına yardımcı bir model ekliyor. Bu yapıda asistan model gelecekteki kelimeleri hızlıca tahmin edip ana modelin önüne getiriyor. Ana model de bunları tek seferde onaylayıp zaman kazanıyor. Telefonda mesaj yazarken kelime tahmini yapılır, tahmin edilen kelimeye dokunup daha hızlı yazarsınız, işte yeni sistemi de böyle düşünebilirsiniz.

Geliştiriciler için projeleri son kullanıcıya ulaştırırken en büyük engel genellikle yavaşlık ve bekleme süreleri oluyor. Yardımcı model sayesinde zamanla yarışan otonom araçlar veya anlık sohbet araçlarında gecikme sorunu büyük ölçüde rafa kalktı diyebiliriz. Google’ın akılcı çözümü özellikle mobil cihazlarda işlemcinin üzerine binen yükü hafifletiyor ve yapılan işlemlerin pili sömürmeden daha akıcı yürümesini sağlıyor.






