OpenAI Akıl Yürütme Modelleri o3 ve o4-mini’yi Duyurdu

ChatGPT erişim sorunları

OpenAI son zamanlarda gaza bastı. Geçtiğimiz gün GPT-4’ü açıklayan şirket ara vermeden o3 ve o4-mini modellerini de ortaya çıkardı. Lafı daha fazla eğip bükmeden neler olduğuna bakalım.

OpenAI, o3’ün akıl yürütme, matematik, kodlama, bilim ve görselleri anlama yeteneklerini ölçen testlerde önceki modellerden daha iyi performans gösterdiğini söyledi ve şimdiye kadar ki en gelişmiş akıl yürütme modeli olduğunu vurguladı. o4-mini ise fiyat, hız ve performans arasında dengeli bir seçenek olarak öne çıkıyor. Bu üç özellik de geliştiricilerin bir yapay zeka modelinde en çok dikkat ettiği faktörler.

OpenAI, Google'a rakip olacak yeni bir ürün yayınladı

o3 ve o4-mini önceki akıl yürütme modellerinden farklı olarak web’de arama, Python kodu çalıştırma, görüntü oluşturma ve görüntü işleme gibi özellikleri kullanarak cevaplar veriyor. Bugünden itibaren bu modeller ve o4-mini’nin başka bir varyantı olan o4-mini-high, OpenAI’ın Pro, Plus ve Team abonelerinin kullanımına sunuldu. o4-mini-high, cevapların doğruluğunu daha isabetli ve tutarlı hale getirmek için daha fazla süre harcıyor.

Bu modeller OpenAI’ın Google, Meta, xAI, Anthropic ve DeepSeek’e karşı olan yeni silahları. Şirket o1 isimli akıl yürütme modelini piyasaya sürmüş olsa da, rakip firmalar o1’i geçen modeller yayınlandı. Aslında yapay zeka şirketleri daha fazla performans elde etmeye çalıştıkça akıl yürütme modelleri alana hakim olmaya başladı. o3 gün yüzü görmeyecekti. Sam Altman şubat ayında o3 teknolojisini içeren daha gelişmiş bir alternatife kaynak ayıracağını ifade etmişti. Fakat artan rekabet baskısı OpenAI’ın rotayı tersine çevirmesine ve planlarını değiştirmesine yol açmış görünüyor.

Galaxy AI ile yeni dönem

OpenAI’ya göre o3, kodlama yeteneklerini ölçen SWE-bench verified’da %69,1 puan alarak en iyi performansa sahip oldu. o4-mini de %68.1 puan almayı başardı. Büyük rakiplerden biri olan Claude 3.7 Sonnet ise aynı testte %62.3 puan aldı. California merkezli şirket o3 ve o4-mini’nin resimlerle düşünebilen ilk modelleri olduğunu da ifade etti. Kullanıcılar çizimler, diyagramlar gibi görüntüler yükleyebiliyor. Yeni yapay zeka modelleri de cevap vermeden önce görüntüleri düşünce zinciri aşamasında analiz ediyor. o3 ve o4-mini bulanık, kötü çıkmış ve düşük kaliteli görselleri anlayabiliyor. Ayrıca görsellerde yakınlaştırma ve döndürme gibi görevleri de gerçekleştiriyor.

OpenAI güvenlik krizi başladı

o3 ve o4-mini, ChatGPT’nin Canvas özelliği sayesinde Python kodunu doğrudan tarayıcıda çalıştırabiliyor ve güncel olaylar hakkında soru sorulduğunda da web’de arama yapıyorlar. o3, o4-mini ve o4-mini-high ChatGPT’ye ek olarak OpenAI’ın geliştiriciler için sunduğu Chat Completions API ve Responses API üzerinden de kullanılabilecek. Böylece geliştiriciler, bu modellerle kendi uygulamalarını oluşturabilecek.

Token maliyeti nedir? o3 yüksek performans sunmasına rağmen düşük ücrete sahip. 1 milyon token’da girdi 10 dolar, çıktı 40 dolar. 1 milyon token neredeyse 750 bin kelime ediyor ve Yüzüklerin Efendisi serisinden daha uzun. o4-mini’nin fiyatı ise o3-mini ile aynı. Yani girdi 1.10 dolar, çıktı da 4.40 dolar. Önümüzdeki haftalarda yalnızca ChatGPT aboneleri için o3-pro modeli yayınlanacak. Bu model o3’e kıyasla daha fazla kaynak kullanıyor.

Apple’dan Vision Air İsimli Ucuz Gözlük Geliyor