Çin merkezli Z.ai, kodlama ve ajan tabanlı iş akışlarını hedefleyen yeni yapay zeka modeli GLM-4.7-Flash’ı yayınladı. Açık lisans, uzun bağlam ve verimlilik iddiası bir arada. Neler olduğuna yakından bakalım…
Z.ai, GLM ailesinin yeni üyesi ‘GLM-4.7-Flash’ı kullanıma sundu. Model, yüksek hız ve düşük maliyet odağıyla geliştirildi. Şirket bu sürümü, kod yazma, görev otomasyonu ve uzun metinlerle çalışan sistemler için konumlandırıyor. GLM-4.7-Flash, MoE (Mixture of Experts) mimarisi kullanıyor. Toplam parametre sayısı 30 milyar seviyesinde. Ancak her sorguda yalnızca yaklaşık 3 milyar parametre aktif hale geliyor. MoE yapısı, modeli hem daha çevik hem de daha az kaynak tüketir hale getiriyor.

En dikkat çekici noktalardan biri de 200 bin tokenlık bağlam penceresi. Bu sayede uzun dokümanlar, büyük kod yığınları veya çok adımlı görevler tek seferde ele alınabiliyor. Z.ai, bu özelliğin ajan tabanlı sistemlerde ciddi bir avantaj sağladığını savunuyor.

Model yalnızca metin tabanlı çalışıyor. Görsel veya sesli giriş desteği yok. Buna karşın açık kaynak dünyasına kapı sonuna kadar açık. 4.7-Flash, ‘MIT lisansı’ ile yayınlandı ve yerel sistemlerde çalıştırılabiliyor. Paylaşılan test sonuçlarına göre Flash sürümü, bazı açık modelleri geride bırakmış durumda. Özellikle yazılım odaklı değerlendirmelerde iddialı skorlara sahip. Kısacası Z.ai, yüksek gösteriş yerine iş gören bir model geliştirdi. Kod yazanlar ve otomasyon peşinde koşanlar için ücretsiz yeni bir alternatif.






