Google, dizüstü bilgisayarlarda yerel olarak çalışabilen Gemma 4 12B isimli yeni modelini tanıttı. Bu model, ses ve görüntüleri harici bir aracıya ihtiyaç duymadan doğrudan anlayarak yüksek hız ve verimlilik sunuyor. İşte detaylar…
Teknoloji devinin açıklamasına göre Gemma 4 12B, Google‘ın küçük modelleriyle üst düzey yapay zekaları arasındaki köprüyü kuruyor. Yeni Gemma sürümü, 16 GB VRAM kapasitesine sahip standart bir bilgisayarda bile son derece gelişmiş mantık yürütme yetenekleri sergiliyor. Böylece kullanıcılar, veri merkezlerine ya da bulut sistemlerine ihtiyaç duymadan, tamamen kendi donanımında çalışan akıllı bir asistana sahip oluyor.

Modelin en dikkat çeken yönü ise Encoder-free, yani ayrı bir kodlayıcıya ihtiyaç duymayan mimarisi. Bunu günlük hayattan bir örnekle açıklamak gerekirse, yabancı bir dili sürekli tercüman aracılığıyla dinlemek yerine o dili doğrudan anlamaya benziyor. Geleneksel yapay zeka modellerinde ses ve görüntü genellikle ayrı kodlayıcılar üzerinden işlenip ana modele aktarılır. Gemma 4 12B ise görüntü ve ses verilerini doğrudan LLM omurgasına taşıyor. Bu tasarım veri işleme sırasında aradaki ek adımları azalttığı için gecikmeyi düşürüyor ve bellek kullanımını daha verimli hâle getiriyor.

Bugüne kadar 150 milyondan fazla indirilen Gemma 4 serisi, geliştiricilerin elinde adeta çok amaçlı bir İsviçre çakısına dönüştü. Google’a göre bu son model, görsel ve işitsel komutları doğrudan algılayabilen ilk orta boyutlu yapay zeka olma unvanını taşıyor. Geliştiriciler açık kaynaklı yapısıyla ücretsiz sunulan modelden birçok projede faydalanabilir.






