Anthropic dedikodular ve sızıntılarda sıklıkla adı geçen Claude Opus 4.7’yi kullanıcıların beğenisine sundu. Yapay zeka devi, yeni modelin zorlu görevlerde Opus 4.6’dan daha yetenekli olduğunu ve daha güçlü görsel analiz becerileriyle donatıldığını söylüyor. En iyisi lafı uzatmadan detaylara birlikte bakalım…
Claude Opus 4.7 talimatları daha sıkı takip ediyor, sonuçları sunmadan önce doğrulamak için yöntem geliştirip kontrol sağlıyor ve yakın gözetim gerektiren karmaşık kodlama işlerinin üstesinden geliyor. Anthropic’e göre 4.7 yalnızca kodlama tarafında değil, görsel algı tarafında da iddialı. Model artık daha yüksek çözünürlüklü görselleri anlayabiliyor. 2.576 piksele kadar yani yaklaşık 3,75 megapiksellik görüntüyü analiz edebiliyor. Biraz daha açıklayıcı olursak kompleks diyagramlardan veri çıkarma, ekran görüntülerini okuyan ajanlar ve piksel düzeyinde hassas referans gerektiren görevler için biçilmiş kaftan.

Firmanın verdiği bilgiye göre Opus 4.7 en üst düzey model olarak tanımlanan Claude Mythos Preview kadar yetenekli değil. Ancak Opus 4.6’ya kıyasla birçok testte çok daha iyi performans gösteriyor. Anthropic geçen hafta duyurduğu Project Glasswing kapsamında, yapay zeka araçlarının siber güvenlik alanında hem fırsatlar hem de riskler yarattığını vurgulamıştı. Bu nedenle Mythos Preview şimdilik sınırlı bir kitleye açık. Yeni siber güvenlik önlemleri ise önce daha düşük kapasiteli modeller üzerinde deneniyor. Opus 4.7 bu geçişte kullanılan ilk sürüm oldu. Çiçeği burnunda model tabii ki yasaklı ya da yüksek riskli siber güvenlik kullanımına işaret eden istekleri otomatik algılayıp engelleyen korumalarla yayınlandı. Şirket gerçek dünyadaki bu kullanımın sonunda elde edilecek verilerin Mythos sınıfı modeller için yol gösterici olacağını ifade ediyor.

Önceki modellere göre yazılmış bazı istemler de (prompt) Opus 4.7’de beklenmedik sonuçlar verebiliyor. Çünkü eski modeller bazı talimatları gevşek yorumluyor ya da bazı kısımları atlıyordu. 4.7 ise komutları kelimesi kelimesine uyguluyor. Bu yüzden geliştiricilere istemlerini ve çalışma düzenlerini yeniden ayarlamaları öneriliyor.
Opus 4.7, Finance Agent benchmark’ında başarılı oldu. Şirket içi testlerde de Opus 4.6’ya göre güçlü finansal analizler yaptı, profesyonel sunumlar hazırladı ve görevler arasında daha sıkı entegrasyon kurdu. Bunun yanında modelin üçüncü taraf GDPval-AA testinde de yüksek performans gösterdiği ifade ediliyor. GDPval-AA, finans ve hukuk dâhil olmak üzere ekonomik değeri olan bilgi işlerini ölçen bir benchmark. Ayrıca Opus 4.7 hafızayı daha pratik ve iyi kullanıyor, uzun ve çok oturumlu işlerde önemli notları hatırlıyor. Bu sayede yeni görevlere daha az başlangıç bağlamıyla geçebiliyor.

Yeni Opus modeli aldatma, kullanıcıyı memnun etmek için yalakalık yapma ve kötüye kullanımda iş birliği gibi riskli davranışlarda düşük oranlara sahip. Dürüstlük ve zararlı komutlara direnç (prompt injection) alanlarında da eskisine göre çok daha iyi.

Şirket, 4.7 sürümüyle birlikte bir dizi ek güncellemeyi de devreye aldı. Bunlardan biri yeni Xhigh yani Extra High seviyesi. Bu seviye High ile Max arasında yer alıyor. Claude Code için de yeni Ultrareview komutu açıklandı. Bu komut yapılan değişiklikleri baştan sona okuyor, hataları ve tasarım sorunlarını işaretliyor. Pro ve Max kullanıcılarının üç ücretsiz Ultrareview hakkı var. Buna ek olarak Auto mode özelliği de Max aboneleri için genişletildi. Auto mode, Claude’un bazı kararları kullanıcı adına almasına izin veren bir yetki seçeneği. Amaç daha az kesintiyle daha uzun işler yürütmek.

Dikkat çekici iki önemli ayrıntı da var. İlk olarak model güncellenmiş bir tokenizer kullanıyor. Bu yapı metni işleme kalitesini artırıyor, fakat aynı girdi türüne göre yaklaşık 1,0 ila 1,35 kat daha fazla token’a dönüşebiliyor. İkinci olarak Opus 4.7 yüksek çaba gerektiren seviyelerde ve ajan temelli senaryolarda daha fazla düşünüyor. Bu da zor görevlerde güvenilirliği artırıyor, lakin aynı zamanda daha fazla çıktı token’ı üretmesine yol açıyor. Anthropic buna rağmen kendi kodlama testlerinde olumlu bir etki gördüğünü belirtti. Yine de geliştiricilere gerçek farkı doğrudan ölçmeleri tavsiye ediliyor. Bunun için de bir rehber yayınlanmış durumda. Fiyatlandırma ise Opus 4.6 ile aynı. 1 milyon giriş token’ı için 5 dolar, 1 milyon çıkış token’ı için 25 dolar.






