Z.ai tarafından geliştirilen GLM-4.7, kullanıcılar arasında büyük bir yankı uyandırdı. Sosyal medya platformları ve Reddit gibi topluluklarda modelin performansı övgüyle karşılandı. Neler olduğuna gelin yakından bakalım…
Z.ai imzalı GLM-4.7, çıkışıyla birlikte Reddit başta olmak üzere pek çok platformda adeta viral oldu. Geliştiriciler ve teknoloji meraklıları, taze modelin yeteneklerini överken, açık kaynak dünyasında çıtanın yukarı taşındığına dair yorumlar yapılıyor. Bu işin mutfağında ise sağlam bir mühendislik var.
GLM-4.7, laboratuvar ortamındaki bir oyuncaktan ziyade, gerçek dünyadaki zorlu yazılım geliştirme süreçleri için tasarlanmış üretime hazır bir sistem olarak karşımıza çıkıyor. Selefi 4.6 ile kıyaslandığında zincirleme akıl yürütme yetenekleri epey geliştirilmiş. Bunu bir yapay zekanın karmaşık bir sorunu tek seferde çözmeye çalışmak yerine, usta bir mühendis gibi adımlara bölerek planlı şekilde ilerlemesi olarak düşünebilirsiniz.

Z.ai ekibi, bu yeni canavarı Claude Code gibi ortamlarda 100 farklı pratik senaryoda teste tabi tutmuş. Ön uçtan (Front-end) arka uca (Back-end) kadar geniş bir yelpazede yapılan denemelerde, modelin görevleri başarıyla tamamladığı belirtiliyor. Üstelik önceki sürümlerdeki lafı dolandırma huyu törpülenmiş, çok daha net ve tok cevaplar veriyor.

Benchmark sonuçlarına da değinmeden olmaz. GLM-4.7, BrowseComp testinden 67.5, τ²-Bench’ten ise 87.4 puan alarak yüksek sonuçlar elde etti. Code Arena’da hangi cevabın hangi modele ait olduğunun gizlendiği ve tamamen tarafsız yapılan oylamalarda zirveye yerleşmesi ise işin ciddiyetini kanıtlıyor. Hugging Face üzerinden erişime açılan GLM-4.7 kodlamada yardımcı arayanlar için en iyi seçeneklerden biri. Bazı kullanıcılar OpenCode ve 4.7 ikilisinin beklenenden daha iyi işler çıkardığını savunuyor.






