Moonshot AI yeni açık kaynaklı kodlama modeli Kimi K2.7 Code’u kullanıma sundu. Geliştirici ekip yeni sürümün az kaynak tüketip, yüksek performans sunduğunu savunuyor. Neler olduğuna yakından bakalım…
Kimi K2.7 Code bir önceki sürüm olan K2.6 ile aynı temeli paylaşıyor. Çiçeği burnunda model, trilyon parametreli MoE (Mixture of Experts) mimarisi üzerine kurulu. Bilmeyenler için MoE, bir şirkette her işi tek kişinin yapması yerine, konuya göre muhasebecinin, avukatın veya mühendisin devreye girmesi gibi çalışan bir yapay zeka mimarisidir. K2.7 Code’un en çok övünülen özelliği ise aşırı düşünme huyundan kurtulması.

Moonshot AI’a göre taze model düşünürken yüzde 30 daha az efor harcıyor. Bu durum arka planda çalışan otonom sistemler için maliyetlerin düşmesi demek. Ayrıca K2.7 Code hazır kütüphaneleri bir araya getirmek yerine kodları doğrudan sıfırdan kendisi yazıyor. Rust, Go ve Python dillerinde daha tutarlı olduğu belirtiliyor. Fakat tüm avantajlara karşın tek modda çalışıyor.

Gelelim dananın kuyruğunun koptuğu yere. Moonshot AI’ın benchmark sonuçlarına baktığımızda kağıt üstünde işler gayet iyi. Ama bağımsız araştırmacılar tarafından yapılan testler K2.7 Code’un pek övüldüğü gibi olmadığını gösteriyor. Mesela araştırmacı Elliot Arledge modeli zorlu bir donanım testine soktu. Çıkan sonuçlar ise beklentilerin altında kaldı. Arledge, K2.7’nin sıfırdan yazdığı kodlarda kendi hataları yüzünden yazılım testlerinde de başarısız olduğunu söyledi.

Geliştirici Sugumaran Balasubramaniyan da sosyal medya üzerinden Moonshot AI’yı eleştirdi. Balasubramaniyan, “Size saygılarımı sunarım. Ancak her yeni model şirket işi benchmark’larda sınıfı rahatça geçer” yorumunda bulundu. Uzmanlar Kimi K2.7 Code’un daha fazla bağımsız teste girmesi gerektiğini savunuyor.






