Bazı geliştiriciler GPT-5’i faydalı bulurken, bazıları hatalarının fazla olduğunu söylüyor. OpenAI’ın performans grafikleri de eleştiri aldı. Neler olduğuna daha yakından bakalım…

OpenAI’ın yeni modeli GPT-5, yazılım dünyasında farklı tepkiler topluyor. Wired’ın raporuna göre GPT-5, akıl yürütme ve planlama alanında güçlü, ama kod üretiminde aynı başarıyı gösteremiyor. Geliştiriciler modelin karmaşık sorunlarda mantıklı adımlar sunabildiğini kabul ediyor, ancak ürettiği kodun kalitesi tartışmalı. Özellikle Anthropic’in Opus ve Sonnet modelleriyle karşılaştırıldığında, GPT-5’in hatalı ya da gereksiz uzun kod parçaları ürettiği ifade ediliyor. “Verbosity” yani metin uzunluğu ayarının da kimi zaman faydadan çok zarar getirdiği belirtiliyor.

openai

Performans ölçümleri de eleştiri oklarının hedefinde yer aldı. Princeton Üniversitesi’nden Sayash Kapoor’un yaptığı bağımsız testler, GPT-5’in doğruluk oranının orta seviyede kaldığını gösterdi. Claude modelleri %51 doğruluk elde ederken, GPT-5 yalnızca %27 oranında başarı sağladı. Buna karşın OpenAI’ın sunduğu grafiklerin, modelin gerçek performansını olduğundan daha güçlü yansıttığı öne sürülüyor. Bazı araştırmacılar bu durumu yanıltıcı tablo (chart crime) kullanımı olarak nitelendirdi.

GPT 5 22

Her şeye rağmen GPT-5’in önemli bir avantajı var, o da maliyet tarafında. Aynı görevleri rakiplerine göre çok daha düşük fiyatla yerine getirebiliyor. Bu durum özellikle büyük ölçekli uygulamalarda tercih sebebi olabilir. Modelin doğruluk oranı düşük olsa da, verimlilik açısından cazip bir seçenek sunuyor.