Anthropic’i tutabilene aşk olsun. Yapay zeka devi, amiral gemisi serisine yeni bir üye daha ekledi. Uzun zamandır dedikoduların odağında olan Claude Sonnet 4.6 kullanıma sunuldu. Fırından yeni çıkmış taze modelin performansına ve yeniliklerine gelin yakından bakalım…
Yapay zeka dünyasında yarış iyice alev aldı. Anthropic kısa süre önce Claude Opus 4.6’yı yayınlamıştı. Aynı dönemde OpenAI’dan GPT-5.3-Codex geldi. Ayrıca Çinli firmalar MiniMax ve Z.ai en üst modellerini çıkardı. Özetle rekabet had safhada. Anthropic şimdi de karşımıza Claude Sonnet 4.6 ile çıktı. Bu gelişme şirketin elinin ne kadar hızlı tuttuğunu gösteriyor. Firma bu versiyonu şimdiye kadarki ‘en yetenekli Sonnet modeli’ olarak tanımlıyor. Beta aşamasında 1 milyon tokenlık bağlam penceresi (context window) sunulması ise dikkat çekici. Bunu basitçe anlatmak gerekirse, modelin hafızası o kadar geniş ki, binlerce sayfalık bir kitabı tek seferde okuyup içindeki en ufak detayı bile hatırlayabiliyor.

Sonnet 4.6’nın güvenlikten de geçer not aldığı belirtildi. Özellikle yapay zekanın olmayan şeyleri gerçekmiş gibi uydurması veya kullanıcı ne duymak istiyorsa onu söylemesi gibi sorunlar epey azaltılmış. Ancak asıl bomba yazılım tarafında. Anthropic, Sonnet 4.6’nın kodlama yeteneklerinin ciddi oranda iyileştirildiğini vurguladı. Bu da yazılımcıların, hata ayıklarken veya yeni bir fonksiyon yazarken daha zeki bir asistana sahip olacağı anlamına geliyor.

Anthropic’in paylaştığı verilere göre Sonnet 4.6 ofis işleri ve finansal analiz gibi ajan tabanlı görevlerde Google Gemini 3 Pro ve OpenAI GPT 5.2 gibi dişli rakiplerini geride bırakıyor. Hatta bazı görevlerde kendi abisi Opus 4.6’dan bile daha iyi sonuçlar veriyor. Sektörden gelen ilk tepkiler de performansı destekler nitelikte. Örneğin VentureBeat’e konuşan yapay zeka destekli sigorta girişimi Pace, gerçekleştirdiği karmaşık bilgisayar kullanım testlerinde Sonnet 4.6’nın diğer tüm Claude modellerinden daha yüksek puan aldığını belirtti.
Benchmark puanları da şu şekilde:
-GPQA Diamond: %89.9
-MMMLU: %89.3
-SWE-bench Verified: %79.6
-ARC-AGI-2: %58.3
-HLE (Humanity’s Last Exam): %49.0

Sonnet 4.6, hem ücretsiz hem de Pro kullanıcılar için claude.ai üzerinde varsayılan model olarak yerini aldı. Ücretsiz planda kullanım limitleri mevcut talebe göre değişiyor ve her beş saatte bir sıfırlanıyor. Profesyonel kullanım içinse fiyatlandırma değişmedi, aylık 20 dolar seviyesinde tutuldu. API üzerinden erişim sağlayacak geliştiriciler içinse milyon token başına girdi maliyeti 3 dolar, çıktı maliyeti ise 15 dolar. Bu fiyatlandırma daha güçlü olan Opus 4.6’ya kıyasla daha düşük.





