Nvidia teknoloji dünyasını ters köşe yaparak herkesin GTC etkinliğinde beklediği yeni nesil Rubin AI platformunu erken bir tarihte tanıttı. Blackwell mimarisine kıyasla performans çıtasını arşa çıkaran bu yeni canavar, HBM4 bellek teknolojisi ve özel Vera işlemcisiyle veri merkezlerinin kaderini değiştirmeye hazırlanıyor. İşte detaylar…
Herkes şirketin GTC etkinliğine odaklanmışken, Nvidia yapay zeka pazarındaki dominasyonunu perçinleyecek Rubin platformunu resmen duyurdu. CES fuarındaki yapay zeka ivmesini değerlendiren şirket, altı farklı yongadan oluşan bu kapsamlı platformun üretimden çıktığını ve laboratuvar ortamında test süreçlerinin başladığını açıkladı. Bu altılı paketin içinde 336 milyar transistörlü Rubin GPU, 227 milyar transistörlü Vera CPU, NVLink 6 anahtarı, ağ tarafında CX9 ve BF4 ile veriyi elektrik yerine ışık sinyalleriyle transfer eden Spectrum-X 102.4T yer alıyor.

Veri merkezlerinin kalbinde atacak olan Vera Rubin Superchip, iki adet Rubin grafik birimi ve bir adet Vera işlemcisini bir araya getiriyor. Bu yapıya HBM4 ve LPDDR5x bellek konfigürasyonları eşlik ediyor. Özellikle Rubin GPU tarafında işler bir hayli ciddileşmiş durumda. Sırf yapay zeka yükleri için tasarlanan bu yonga, NVFP4 çıkarım (Inference) işlemlerinde 50 PFLOP, eğitim performansında ise 35 PFLOP gibi dudak uçuklatan değerlere ulaşıyor. Bu da halefi Blackwell’e kıyasla sırasıyla 5 ve 3.5 katlık bir performans sıçraması demek. Yongada kullanılan HBM4 teknolojisi yani verilerin işlemciye çok daha geniş bir otobandan akmasını sağlayan yüksek bant genişlikli bellek mimarisi, yonga başına 22 TB/s bant genişliği sunarak selefini neredeyse üçe katlıyor.

Bilmeyenler için şunu da açıklayalım; çıkarım veya tam adıyla Inference, eğitilmiş bir modelin yeni verileri işleyip sonuç üretmesi aşaması için kullanılıyor. ChatGPT’nin yazılan soruya cevap vermesi buna örnek verilebilir.
İşlemci kanadında ise Nvidia’nın Vera adını verdiği ve Olympus kod adlı yeni nesil özel Arm mimarisi karşımıza çıkıyor. Tam 88 çekirdek ve 176 thread sunan bu işlemci, Nvidia Spatial Multi-Threading teknolojisiyle donatılmış. Grace işlemcisine kıyasla üç kat daha fazla sistem belleği sunan Vera, 1.5 TB kapasiteye ve SOCAMM LPDDR5X ile 1.2 TB/s bellek bant genişliğine sahip. Kısacası veri işleme, sıkıştırma ve sürekli entegrasyon süreçlerinde Grace’in iki katı performans vadediyor.

Bağlantı tarafında ise işler su gibi akıp gidiyor. NVLink 6 anahtarı, CPU başına 3.6 TB/s bant genişliği sunarken sistemin tamamı yüzde 100 sıvı soğutma ile çalışıyor. Ağ tarafında ise ConnectX-9 SuperNIC devreye giriyor. 200G PAM4 SerDes yani veriyi tek hat üzerinden seri şekilde gönderip alan birimler sayesinde 1.6 TB/s hıza ulaşılıyor. BlueField-4 ise 800G DPU olarak akıllı ağ kartı ve depolama işlemcisi görevini üstleniyor ki, içinde 64 çekirdekli bir Grace işlemcisi barındırıyor.

Tüm bu bileşenlerin birleştiği Nvidia Vera Rubin NVL72 kabini ise adeta bir gövde gösterisi niteliğinde. 3.6 EFLOPS NVFP4 çıkarım performansı, 54 TB LPDDR5x kapasitesi ve 1.6 PB/s HBM4 bant genişliği ile Blackwell’e büyük fark atıyor. Ayrıca Spectrum-X Ethernet Co-Packaged Optics çözümüyle verimlilik beş kat, güvenilirlik ise on kat artırılmış.
Nvidia, bu platformun Blackwell GB200’e kıyasla çıkarım maliyetlerini on kat, model eğitimi için gereken GPU sayısını ise dört kat düşürdüğünü de belirtiyor. Tam üretime geçen ve ortaklar tarafından desteklenen Rubin yongaları, bu yılın sonlarına doğru ilk müşterilere ulaşmaya başlayacak.






