Microsoft doktorlara kafa tutan yapay zeka destekli teşhis sistemini tanıttı. AI Diagnostic Orchestrator (MAI‑DxO) adı verilen bu araç, karmaşık tıbbi vakalarda gerçek doktorların dört katı kadar doğru teşhis koyarak dikkatleri üzerine çekti.

Sistemin temelinde her biri farklı rol üstlenen, beş AI Agent’ın yer aldığı dijital bir ekip var. AI Agent da kısaca belirli bir göreve odaklanan yapay zeka modeline denir. Bu sanal ekipte bir model hipotez geliştirirken, bir diğeri hangi testlerin yapılması gerektiğini öneriyor, bir başkası önerileri değerlendiriyor ve son karar da ortak tartışma sonucunda veriliyor. Microsoft bu yönteme ‘tartışma zinciri’ adını vermiş. MAI‑DxO’nun amacı sadece doğru teşhis koymak değil, nasıl karar verdiğini de teker teker şeffaf biçimde anlatmak.

microsoft

Microsoft, sanal doktor ekibini OpenAI, Meta, Google, Anthropic, xAI ve DeepSeek’in yapay zeka modelleriyle test etti. Bu testte 304 karmaşık vaka içeren New England Journal of Medicine makaleleri kullanıldı. Sistem tüm modellerle başarılı sonuçlar üretti. Fakat en iyi performansı ise %85.5’lik teşhis oranıyla OpenAI’ın o3 akıl yürütme modeli gösterdi. Aynı vakalar üzerinde çalışan gerçek doktorlar ise sadece %20’lik başarıya ulaştı. Ancak doktorların bu karşılaştırmada kitap, rehber ya da meslektaş görüşünden yararlanmadığını da belirtelim.

Microsoft ve Truecaller'dan büyük işbirliği

Microsoft’un yapay zeka biriminin başındaki isim Mustafa Suleyman, MAI‑DxO’u sağlıkta ‘tıbbi süper zekaya giden yolun ilk adımı’ olarak tanımlıyor. Doğru teşhisle birlikte hızlı ve ucuz sağlık hizmeti de hedefleniyor. Yazılım devinin planları arasında MAI‑DxO’u Copilot hizmetlerine ve Bing arama motoruna entegre etmek var. Bing günde 50 milyon sağlık sorgusu alıyor.

Eski DeepMind Health lideri Dominic King ise sistemin sadece doğru değil, ekonomik kararlar da verdiğini söyledi. Yapay zekaya maliyet bilinci aşılanarak, teşhis için gereken test sayısı ciddi biçimde azaltıldı. Bazı vakalarda yüz binlerce dolar tasarruf sağlandı. Yine de bu sistem henüz klinik ortama hazır değil. Sonuçlar bilimsel hakem sürecinden geçmedi ve gerçek dünya testleri yapılmadı. Diğer yandan Scripps Araştırma Enstitüsü’nden kardiyolog Eric Topol, MAI‑DxO’u dönem noktası olarak nitelendiriyor.