Meta ve Harvard İş Birliğinden Kodlamanın Kitabını Yazan ‘Confucius Code Agent’ Geldi

yapay zea

Yazılım dünyasında ibre, modelin ham zekasından ziyade zekanın nasıl kullanıldığına doğru kayıyor. Meta ve Harvard araştırmacıları, sadece güçlü bir beyne değil, aynı zamanda beyni verimli kullanacak bir vücuda sahip olan yeni yapay zeka yazılım mühendisi ‘Confucius Code Agent’ı duyurdu. Büyük ölçekli kod tabanlarında kaybolmadan çalışan ve kendi hatalarından ders çıkaran bu sistem, orta ölçekli modellerin bile devler liginde oynamasını sağlıyor. Neler olduğuna yakından bakalım…

Bugüne kadar teknoloji dünyası dil modellerinin ne kadar büyük parametrelere sahip olduğuyla ilgilendi, ancak Confucius SDK ile rüzgar tersten esmeye başlıyor. Araştırmacılar asıl marifetin modelin kendisinde değil, onu çevreleyen çalışma ortamında yani ‘Scaffold’ yapısında bittiğini söylüyor. Bir marangoz ustası düşünün, ne kadar yetenekli olursa olsun, dağınık ve eksik aletlerin olduğu atölyede iyi iş çıkaramaz. İşte yeni araç, yapay zekaya muazzam bir çalışma disiplini ve organize bir atölye ortamı kazandırıyor.

Confucius

Gerçek hayattaki yazılım projeleri karmaşıktır ve onlarca dosyayı aynı anda düşünmeyi gerektirir. Standart modellerin hafızası bir süre sonra silinmeye başlarken, Confucius Code Agent hiyerarşik bir çalışma belleği kullanıyor. Üstelik sistem sadece anı kurtarmakla kalmıyor, ‘Persistent note taking’ özelliği sayesinde notlar alıyor. Tıpkı tecrübeli bir mühendis gibi, ‘bunu daha önce denemiştim, ama çalışmamıştı’ diyerek eski hatalarından ders çıkarıyor ve bu bilgiyi sonraki işlerine taşıyor. Böylece işlem yükünü hafifletirken, hedefe çok daha kestirme yoldan ulaşıyor.

Yapay Zekâ

Test sonuçları ise gerçekten dudak uçuklatan cinsten. Yapılan ölçümlerde, iyi bir Scaffold yapısıyla desteklenen Claude 4.5 Sonnet modeli, kendisinden çok daha güçlü ve büyük olan Claude 4.5 Opus modelini geride bırakmayı başardı. Diğer bir deyişle doğru araçlarla donatılmış orta sıklet bir model, ağır sıklet rakibini teknik nakavtla yendi. Confucius ayrıca kendi kendini geliştiren bir meta ajana sahip; bu yapı sürekli olarak komutları ve araçları test edip iyileştiriyor. Açık kaynak olarak sunulan proje, GitHub üzerindeki gerçek projelerde ve uzun soluklu kodlama maratonlarında yapay zeka mühendislerinin neler yapabileceğini gözler önüne sererken, sektörde yeni bir değişimin kapısını da araladı.

DeepSeek V4 Gün Sayıyor! Silikon Vadisinin Kabusu Geri Dönüyor