ChatGPT’nin arkasındaki şirket olan OpenAI, Dall-E 3 ile görsel üretimi için kullanılan yapay zekalarda da zirveye oynayacak gibi duruyor.
Şu anda genel kullanıcıya ulaşan yapay zeka teknolojileri iki koldan ilerliyor. Bir tarafta ChatGPT ve Google Bard gibi gelişmiş dil modelleri kullanıcı komutlarından yola çıkarak pek çok farklı komutu yerine getirebiliyor. Diğer tarafta ise Midjourney ve Stable Diffusion gibi programlar, yazılı komutlardan yola çıkarak son derece ilgi çekici görseller ve hatta videolar ortaya çıkarıyor. Yapay zekanın görsel üretimi için kullanıldığı bu programlar, her geçen gün biraz daha gelişiyor.
ChatGPT ile dil modellerine öncülük eden OpenAI şimdilik görsel üretim programlarında Midjourney ve Stable Diffusion’ın biraz gerisinde kalmış olsa da aslında onlar da Dall-E ile etkileyici bir programa sahip. Üstelik bu program çok yakında daha da etkileyici bir hal alacak gibi duruyor. Çünkü yeni tanıtılan Dall-E 3, öncülüne göre çıtayı daha da yükseltiyor.
OpenAI, Dall-E 2’de öğrendikleri her şeyi kullanarak Dall-E 3’ün görsel üretim kabiliyetlerini bir sonraki seviyeye taşıdıklarını söylüyor. Şirketin tanıtım sırasında sergilediği görseller de şirketin görsel üretim teknolojisinde epey yol kat ettiğini gösteriyor. Dall-E’nin bu yeni versiyonu özellikle iki konuda ciddi aşama kaydetmiş durumda. Bunlardan biri ellerin tasarımı gibi insan anatomisinin farklı parçalarını daha iyi resmedebiliyor olması, ikincisi ise resim içine yazıları artık eskisinden çok daha doğru şekilde yerleştiriyor olması. Bildiğiniz gibi şu anda Dall-E ve benzeri yapay zeka programlarının en çok zorlandığı iki konu bu olabilir. Çünkü görsel içi yazılar ve el tasarımları gibi detaylar bir türlü kusursuz hale getirilememişti. Ancak Dall-E 3 bizi bu kusursuz tasarımlara bir adım daha yaklaştıracak gibi görünüyor.