Google, Gemma 3 mimarisi üzerine kurduğu ve performansıyla dikkat çeken yeni dil araçlarını duyurdu. 55 farklı dilde iletişim kurmayı sağlayan ve donanım dostu yapısıyla öne çıkan çiçeği burnunda seri, mobil cihazlardan güçlü sunuculara kadar geniş bir yelpazede çalışabiliyor. Lafı daha fazla uzatmadan detaylara birlikte göz atalım…
Google‘ın teknoloji dünyasına sunduğu yeni model ailesi, TranslateGemma adını taşıyor ve 4B, 12B ile 27B olmak üzere üç farklı boyutta geliyor. Açık kaynak dünyasında çıtayı yukarı taşıyan bu adım, kullanıcıların elindeki cihaz ne olursa olsun dil bariyerlerini aşmasını hedefliyor. Şirket seriyi geliştirirken verimlilikten ödün vermeden kaliteyi korumaya odaklanmış.

Teknik incelemelere baktığımızda karşımıza oldukça iddialı bir tablo çıkıyor. 12 milyar parametreli model, kendisinden çok daha büyük olan önceki nesil 27 milyar parametreli Gemma 3’ü geride bırakıyor. Bunu günlük hayattan bir örnekle açıklayacak olursak, devasa bir ansiklopedideki tüm kritik bilgilerin, tek bir satırı bile atlamadan incecik bir cep defterine sığdırılmasına benzetebiliriz. Geliştiriciler için tam bir nimet, çünkü sistem kaynaklarını yormadan yüksek kalitede çeviri yapabilmek artık mümkün. Üstelik 4B boyutundaki en küçük model mobil cihazlarda işlem yaparak boyundan büyük işler başarıyor.

Serinin temelinde Google’ın Gemini modellerinden elde ettiği sezgileri daha küçük yapılara aktarması yatıyor. Bu süreçte iki aşamalı özel bir eğitim yöntemi kullanılmış. İlk olarak Supervised Fine-Tuning (SFT) tekniği devreye giriyor. SFT’yi bir öğrencinin ders kitabındaki doğru cevaplara bakıp konuyu öğrenmesi gibi düşünün. Ardından çeviri kalitesini mükemmelleştirmek için Reinforcement Learning (RL) yani pekiştirmeli öğrenme kullanılıyor. RL yöntemi ise öğrencinin deneme yanılma yoluyla ve aldığı geri bildirimlerle kendini geliştirmesine benziyor.

TranslateGemma sadece metinleri değil, görselleri de anlıyor. Multimodal (çok modlu) yetenekleri sayesinde, görsel içindeki metinleri de başarıyla çevirebiliyor. Testlerde modelin özel bir görsel eğitimi almamasına rağmen metin çevirisindeki başarısının görsel tarafa da olumlu yansıdığı görüldü.
55 ana dil destekleniyor, ancak Google arka planda yaklaşık 500 farklı dil çifti üzerinde de deneysel çalışmalar yapıyor. Bu geniş kapsam, araştırmacıların kendi projeleri için sağlam bir temel oluşturmasına olanak tanıyor. Mobil odaklı 4B modelden, buluttaki H100 işlemcilerde çalışacak 27B modele kadar her ihtiyaca uygun bir seçenek sunan TranslateGemma, Hugging Face ve Kaggle gibi platformlar üzerinden erişime açıldı.






