Google, Gemma 3 mimarisinin güçlü altyapısını kullanan ve verimliliğiyle öne çıkan yeni T5Gemma 2 ailesini duyurdu. Hem metin hem de görsel işleyebilen taze model, cihaz içi yapay zeka deneyimini farklı boyuta taşıyacak görünüyor. İşte detaylar…

Bu aralar Google‘ı tutabilene aşk olsun, Mountain View merkezli firma Gemini 3 Flash’tan sonra T5Gemma 2’yi açıkladı. Kodlayıcı ve kod çözücü mimarisinin sınırlarını zorlayan bu model, görsel ve metin tabanlı verileri aynı potada eritiyor. Mühendislik tarafında yapılan iyileştirmeler tamamen verimlilik odaklı kurgulanmış. Google kelime işleme katmanlarını ve odaklanma sistemlerini tek bir yapıda birleştirerek işlem yükünü ciddi oranda hafifletmiş. Bu gelişme daha az parametre ile daha yüksek performans elde edilmesini sağlıyor. Özellikle 270 milyon parametreli sürüm, donanım kaynaklarını yormadan doğrudan cihaz üzerinde çalışabilmesiyle dikkat çekiyor.

Google

T5Gemma 2 sadece metinleri değil görselleri de işleyebilen ‘çok modlu’ bir yapıya sahip. Kullanıcılar görseller üzerinden soru sorabiliyor veya karmaşık mantık yürütme işlemlerini gerçekleştirebiliyor. Modelin hafızası da bir hayli genişletilmiş durumda. 128 bin token seviyesine ulaşan bağlam penceresi, uzun belgelerin analiz edilmesini hiç olmadığı kadar kolaylaştırıyor. Dil desteği konusunda da eli güçlenen model, kutudan çıktığı gibi 140’tan fazla dilde iletişim kurabiliyor.

google 4

Performans testlerine baktığımızda T5Gemma 2’nin kodlama ve akıl yürütme gibi kritik alanlarda, Gemma 3 modellerini geride bıraktığını görüyoruz. Geliştiriciler ve araştırmacılar için sunulan bu eğitilmiş temel modeller, yapay zeka ekosisteminde yeni projelerin filizlenmesine olanak tanıyacak.