Google Gemini 3 Hakkında Her şey

gemini 3

Birkaç gündür Google kazan gibi kaynıyordu ve sonunda Gemini 3 resmen açıklandı. Gemini 3 neler sunuyor? Özellikleri nedir? Testlerdeki performansı? İşte detaylar…

Google ağzındaki baklayı çıkardı, Gemini 3 Pro’yu tanıttı. Yeni model hem kullanıcılar hem de geliştiriciler için bugün itibarıyla AI Studio ve API üzerinden erişilebilir durumda. Gemini 2.5’tan sadece 7 ay sonra gelen Gemini 3 Pro, Google’ın bugüne kadarki en yetenekli büyük dil modeli (LLM) ve şu anda piyasadaki en yetenekli yapay zeka aracı olmaya da aday.

Gemini ürün geliştirme müdürü Tulsee Doshi yaptığı açıklamada, “Gemini 3, akıl yürütmede büyük bir sıçrama yaptı. Daha önce hiç görmediğimiz şekilde yanıtlar veriyor” diyerek modelin ne kadar gelişmiş olduğunu vurguladı. Gemini 2.5’tan çok daha doğal, akıcı ve derin cevaplar üretiyor. Gemini 3 Deepthink modeli de yolda. Fakat Deepthink güvenlik testlerinden geçtikten sonra önümüzdeki haftalar içinde Ultra aboneleri için aktif olacak.

google 3

Akıl Yürütme ve Farklı Veri Türlerini İşlemede Çıtayı Yükseltti

Gelelim testlere. Gemini 3 Pro’nun akıl yürütme kapasitesinde ciddi bir artış var. Humanity’s Last Exam gibi üst seviye akıl yürütme gerektiren testlerde yüzde 37,5 başarı elde etti. ARC-AGI-2 skorunun ‘ARC Prize Verified’ olarak doğrulandığı da belirtiliyor. Modelin farklı veri türlerini birlikte işleyebilme yeteneği de geniş kapsamda test edildi.

Video-MMMU ölçümleri media_resolution=HIGH, kare başına 280 token ve temperature=0 parametreleriyle çalıştırıldı. ScreenSpot-Pro testinde ise model, ekran görüntüsünü alıp doğrudan işlediği basit bir düzenekle değerlendirildi. Bu testin de görsel analiz için yapıldığını belirtelim. Gemini 3 Pro tüm bu sınavlarda beklenenin üzerinde performans gösterdi.

google 2

Kodlama testlerinde LiveCodeBench Pro, Terminal-Bench 2.0 ve SWE-bench Verified gibi zorlu ölçümler kullanıldı. Google özellikle SWE-bench Verified için özel bir yöntem geliştirdi. Bu yöntem bash komutları (terminalden girilen komutlar), dosya düzenleme araçları ve geri alma sistemleriyle tek seferlik çözüm üretmeye odaklanıyor. Ajan yetenekleri için kullanılan τ2-bench testi, perakende, havayolu ve telekom alanlarını kapsıyor. Gemini 3 Pro bu üç alanda sırasıyla yüzde 85,3, yüzde 73 ve yüzde 98 başarı elde etti.

Google Gemini For Home 832x468 1

Öğrenme, İnşa Etme ve Planlama Yeteneği

Google, Gemini 3 Pro’nun üç temel kullanım alanını ön plana çıkarıyor. Akademik makaleler, video dersler veya el yazısı metinler gibi pek çok kaynağın analiz edilebildiği ‘öğrenme’ tarafı daha olgun hale getirilmiş. Bu hattı tamamlayan ikinci alan da kodlama dünyası. Burada iki yaratıcı yaklaşım öne çıkıyor. ‘Vibe coding’ kabaca tasarlanmış fikirleri hızla prototipe dönüştüren bir çalışma biçimi olarak tanımlanıyor. ‘Agentic coding’ ise modelin kendi karar adımlarını oluşturarak görevi parçalara ayırdığı ve bunları sırayla tamamladığı yarı-özerk bir kod yazma yöntemi. Bu iki yaklaşım ‘inşa etme’ sürecini güçlendiriyor. Çok adımlı görevleri yönetebilen planlama kapasitesi ise uzun süreli senaryolarda modelin istikrarını ortaya koyuyor.

google

Güvenlik Testleri Genişletildi

Gemini 3 Pro’nun şimdiye kadarki en kapsamlı güvenlik değerlendirmesinden geçtiği ifade edildi. Sürekli iltifat etmesi aslında yalakalık dediğimiz sycophancy azaltıldı. Prompt-injection saldırılarına karşı korumalar güçlendirildi. Ayrıca yeni FACTS Benchmark Suite, önceki FACTS sonuçlarıyla kıyaslanamayacak kadar geniş bir doğruluk seti sunuyor. Gemini 3 Pro yalnızca güçlü bir model değil, aynı zamanda detaylı bir test sürecinden geçmiş bir sistem. Yapılan açıklamalar ve paylaşılan raporlar arka planda işlerin ne kadar sıkı tutulduğunu açıkça gösteriyor.

Apple, iPhone kullanıcılarının Siri’yi üçüncü taraf bir asistanla değiştirmesine izin vermeye hazırlanıyor