Apple Intelligence, Nvidia ve Anthropic zekasını YouTube’a borçlu!

Metinlerden video oluşturma modeli için daha önce OpenAI’nin YouTube içeriklerini kullandığı ortaya çıkmıştı. Gelen son bilgilere göre de Apple, platformun içerik politikasına aykırı olarak Apple Intelligence’ı eğitmek için altyazılı on binlerce YouTube videosu kullandı.

Apple Intelligence dışında Nvidia, Anthropic ve daha fazlası gibi şirketlerin de AI modellerini eğitmek için kullanıcılar tarafından oluşturulan ‘kamuya açık verileri’ kullandığı bildiriliyor.

Apple ve diğer büyük teknoloji şirketleri, 48.000’den fazla kanaldan 173.536 YouTube videosunun transkriptlerini içeren “YouTube Altyazıları” adlı bir veri kümesini kullanıyor. Bu veri kümesi, eğitim kanallarından (Khan Academy, MIT) haber sitelerine (The Wall Street Journal) ve popüler içerik üreticilerine (MrBeast, Marques Brownlee) kadar geniş bir yelpazeyi kapsıyor.

MrBeast

Marques Brownlee, Apple, Apple Intelligence’ın yapay zekasını eğitmek için YouTube videolarından doğrudan veri kullanmaktan kaçındığını, bunun yerine transkriptleri kullanan şirketlerden veri aldığını belirtiyor. Bu teknik olarak bir “hata” olmasa da, veriler ve transkriptler, içerik üreticilerin yapay zeka modellerine katkıda bulunmak için harcadıkları zaman ve paraya dayanıyor. Brownlee, bu durumun uzun vadede süregelen bir sorun olacağını vurguluyor.

Proof News, içerik oluşturucuların içeriklerini veri setinde aramaları için bir araç geliştirdi. YouTube Altyazıları veri seti, videolardan alınan görüntüleri içermiyor ancak bazı dillerde çevrilmiş altyazıları içeriyor. Bu veri seti, açık bilim normlarını teşvik etmeye odaklanan Eleuther AI adlı kar amacı gütmeyen bir araştırma laboratuvarı tarafından oluşturuldu.

Apple Intelligence

 

Adı geçen şirketler, konu hakkında hemen yorum yapmadılar. Ancak, YouTube CEO’su Neal Mohan, şirketlerin yapay zeka modellerini eğitmek için YouTube videolarını kullanmasının platformun politikalarının “açık bir ihlali” olduğunu belirtti.

YouTube Altyazıları veri seti, yapay zeka eğitiminde önemli bir kaynak olarak kullanılıyor. Ancak, bu durum içerik oluşturucular ve platform politikaları açısından çeşitli sorunları da beraberinde getiriyor. Özellikle içerik üreticilerin emeklerinin yapay zeka modellerine katkı sağlaması ve bu süreçte yaşanan etik sorunlar, gelecekte daha fazla tartışma konusu olacak gibi görünüyor.

 

ASUS, yeni oyun dizüstü bilgisayarını ön siparişe sundu