Çin merkezli teknoloji girişimi StepFun, kapalı kaynaklı rakiplerine kafa tutan ve otonom iş akışlarına özel tasarlanan Step 3.5 Flash’ı kullanıma sundu. Yüksek analiz yeteneği, kararlılık ve işlem hızı vadeden modelin ayrıntılarına yakından bakalım…
StepFun sonunda sessizliğini Step 3.5 Flash ile bozdu. Şirket yeni modelini ‘ajanlar için doğmuş’ bir proje olarak konumlandırıyor. Sürekli her yerde geçen ajan tam olarak nedir? Ajan (AI Agent) karmaşık görevleri planlayıp adım adım sonuca ulaştıran otonom yazılımlara deniyor. Step 3.5 Flash’ın öne çıkan en belirgin özelliği ise uzun vadeli ve çok basamaklı işlerde gösterdiği performans. Özellikle kodlama görevlerinde saniyede 350 token (kelime parçacığı) üretebilen bir hızdan bahsediyoruz ki, anlık yanıt bekleyen sistemler için oldukça kritik bir seviye. StepFun’a göre yeni nesil modellerin sadece ‘zeki’ olması yetmiyor; aynı zamanda güvenilir, seri ve cep yakmayan bir yapıda olması gerekiyor.

Mühendisler dengeyi kurabilmek için mimaride bazı radikal tercihler yapmış. ‘Mixture-of-Experts – MoE’ tekniği kullanılmış. Toplamda 196 milyar parametreye sahip olan model, her işlemde bunların sadece 11 milyarını aktif hale getiriyor. Mesela devasa bir kütüphanedeki tüm kitapları taramak yerine, sorunun cevabının bulunduğu rafa gidip sadece ilgili kitabı okumaya benzetebiliriz. Böylece işlem gücünden tasarruf edilirken hız artırılıyor.

Bir diğer teknik yenilik ise ‘Multi-Token Prediction – MTP-3’ teknolojisi. Standart yapay zekalar kelimeleri tek tek tahmin ederek ilerlerken, Step 3.5 Flash her adımda üç parçayı birden öngörüyor. Yani sistem cümleyi heceleyerek değil, bloklar halinde tamamlıyormuş gibi çalışarak verimliliği ikiye katlıyor. 256 bin birimlik bağlam kapasitesi sayesinde çok uzun belgeleri hafızasında tutabiliyor. Bunu yaparken de dikkatinin bir kısmını metnin geneline, bir kısmını ise o anki önemli bölüme odaklayan hibrit bir dikkat mekanizması kullanıyor.
Öte yandan StepFun bir sonraki büyük sıçrama olması beklenen Step 4 modelinin eğitim sürecine başladığını da duyurdu. Ayrıca geliştiriciler ve araştırmacılar yeni ekosistemi büyütmek üzere projeye katkı sunmaya davet edildi.






