ChatGPT’yi muhtemelen duymuşsunuzdur. Fakat ChatGPT ve benzeri üretken yapay zekayı eğitmek için büyük dil modellerinin (LLM – Large Language Model) kullanıldığını duymuş olmanıza rağmen, bu modelleri hayata geçirmek için gereken bilgi işlem gücünün boyutunu bilmiyor olabilirsiniz. LUMI ile tanışın.
ChatGPT için kullanılan sürüm gibi LLM’ler genellikle İngilizceye dayalı olduğundan, akademik araştırma söz konusu olduğunda yeterince kullanışlı olmayabiliyor ve dil çeşitliliğinin yetersiz olması kullanıcılar için bir engel oluşturabiliyor.
Finlandiya merkezli Turku Üniversitesi bu durumu değiştirmek için harekete geçerek, Avrupa dillerinin rahat kullanılabileceği büyük dil modellerini oluşturacak LUMI süper bilgisayarını kullanmak için Avrupa’daki 10 üniversite araştırma laboratuvarıyla iş birliği yaptı. Gelecekte, akademik araştırma ve eğitim amacıyla kullanılmak üzere en azından tüm resmi AB dilleri ve diğer birkaç dil için temel modeller oluşturmayı umut ediyorlar.
AMD Instinct GPU’lar ve EPYC CPU’lar tarafından desteklenen LUMI süper bilgisayarı – yakın zamanda Avrupa’nın en hızlı süper bilgisayarı ve aynı zamanda enerji açısından en verimli süper bilgisayarlarından biri olarak gösterildi – TurkuNLP Group’un makul bir süre içinde yeni modeller oluşturmasına olanak tanıyor. Bunu bir bağlama oturtmak gerekirse LUMI, Finlandiya’da bulunan önceki nesil makinelerden yüz kat daha büyük işlem gücüne sahip. Önceden, ekibin bir bilgisayarda 1 milyar parametreli dil modelini önceden eğitmesi yarım sene sürerken, şimdi LUMI’nin yaklaşık 40 milyar belirteci, karakterleri, heceleri veya sözcükleri işlemesi yalnızca iki hafta sürüyor.
CSC’de Makine Öğrenimi Uzmanı Väinö Hatanpää, “LUMI ile bilgi işlem kapasitesi ve daha fazla ölçeklendirme yeteneği, müşterilerimizin Makine Öğrenimi/Yapay Zeka sınırlarını zorlamasını sağlıyor” açıklamasını yaptı.