Bomba duyurular arka arkaya patladı. OpenAI ve Anthropic dışında Google DeepMind da Genie 3 isimli yeni yapay zeka modelini duyurdu. Bu model etkileşimli sanal evrenler inşa ediyor.

Google DeepMind yapay zeka araştırmalarındaki bir sonraki adım olan Genie 3’ü tanıttı. Yeni AI modeli, yalnızca basit metin komutlarıyla çalışan, tamamen yapay 3D ortamlar yaratıyor. Bu dünyalar saniyede 24 kare hızında ve 720p çözünürlüğünde görüntüleniyor. Model her kareyi bir öncekine bakarak sırayla üretiyor. Bu sayede görsel bütünlük ve fiziksel tutarlılık birkaç dakikalık etkileşim boyunca korunuyor. Google’a göre Genie 3’ün yetenekleri ve yaptıkları daha önce benzeri görülmemiş bir başarı.

google

Klasik video üretim modellerinden farklı olarak Genie 3 kullanıcıdan gelen komutlara anlık tepki veriyor. Kullanıcı objeleri, hava durumunu ya da ortamı anında değiştirme imkanına sahip. Böylece beklenmedik olaylara karşı yapay zekanın tepkisi test edilebiliyor.

Genie 3’ün önceden yüklenmiş veriye ihtiyacı yok. NeRF ya da Gaussian Splatting gibi tekniklerden farklı olarak, çevreyi doğrudan metinden oluşturuyor. Yapay zeka ajanları da, bu dinamik ortamlar içinde fizik kurallarını önceden kodlamaya gerek kalmadan, kendi kendine öğrenebiliyor. Google şu anda Genie 3’le kendi otonom ajanı SIMA’yı test ediyor.

Google hesap açmayı engelliyor

Henüz geliştirme aşamasında olan Genie 3, sınırlı sayıda araştırmacıya açıldı. Google sürecin potansiyel riskleri erkenden ortaya çıkarmayı ve güvenli geliştirmeyi hedeflediğini belirtti. Yeni AI modeli uzun vadede eğitim, karar simülasyonu ve uzman eğitimi gibi alanlarda kullanılabilecek. Ayrıca Genie 3 için bazı sınırlamalar mevcut. Simülasyon birkaç dakikayla sınırlı, çoklu ajan etkileşimi desteklenmiyor ve bazı görseller sadece istemlerde açıkça belirtildiğinde ortaya çıkıyor.

Google bu çalışmayı, genel yapay zeka (AGI) geliştirme yolunda bir dönüm noktası olarak görüyor. AGI, insan benzeri zekaya sahip, farklı görevleri öğrenip uygulayabilen yapay zeka anlamına geliyor.