Teknoloji dünyasındaki titanlar savaşı iyice kızıştı. Google’ın son dönemdeki yükselişine karşı sessizliğini bozan OpenAI, görsel üretimdeki dengeleri değiştirecek yeni modelini kullanıma sundu. İşte detaylar…
Google’ın Gemini 3 ve Nano Banana Pro ile zirveye doğru ilerlemesi, OpenAI cephesinde kırmızı alarm ilan edilmesine neden olmuştu. Sam Altman ve ekibi kaybedilen mevzileri geri kazanmak için kolları sıvadı. Normalde ocak ayında yapılması beklenen lansman yoğun rekabet baskısıyla erkene çekildi ve GPT Image 1.5 modeli sahneye çıktı.

GPT Image 1.5 önceki versiyona göre talimatları çok daha iyi anlıyor ve tam dört kat daha hızlı çalışıyor. Ancak asıl devrim düzenleme yeteneğinde yatıyor. Görsel üretimindeki en büyük karın ağrısı olan tutarlılık sorunu bu modelle çözüldü. Mevcut sürümde “Arka planı bulanıklaştır” ya da “Surat ifadesini değiştir” dendiğinde genellikle tüm resim baştan aşağı değişiyor ve kompozisyon bozuluyordu. Yeni model ise yüz benzerliği, ışık ve renk tonu gibi kritik detayları koruyarak nokta atışı düzenlemeler yapılmasını mümkün kılıyor.

Kullanıcılar kendi yüzlerini sisteme bir kez yükleyip sonraki tüm görseller aynı tutarlılıkla kullanabiliyor. Bununla birlikte ChatGPT’ye yeni bir göseller arayüz de eklendi. Arayüz sade ve kolay kullanım için tasarlanmış. Hazır filtreler ve trend komutlar tamamen kullanıcıların elinin altında bulunuyor. Ayrıca GPT Image 1.5 yoğun ve küçük metinleri görselleştirme konusunda da oldukça iddialı.

Geliştiriciler için de sevindirici haberler var. Modelin API maliyeti selefine göre %20 daha ucuz. OpenAI bu adımla yeni özelliklerin daha geniş ölçekte kullanılmasını hedefliyor. Öte yandan OpenAI Uygulamalar CEO’su Fidji Simo yeni yaklaşımı “Görseller hikayeyi kelimelerden daha iyi anlattığında, ChatGPT bunları içermeli” sözleriyle özetledi. Açıkçası yapay zeka devi insanların aklındakilerle ekrana yansıyanlar arasındaki mesafeyi kapatmaya kararlı görünüyor.





