13 Milyon Kişiyi Nasıl Bir Araya Getirirsiniz?

ku bigpic1

Bir genom korsanına bir çeşit bilgisayar bilimcisinin bir biyoloğa evrimi izin verirseniz, dünyanın çevrimiçi secere sitelerine ne olur? Dünyanın en büyük aile ağacı mı? 13 milyondan fazla insanın akraba olduğu bir aile ağacını nasıl gösterirsiniz?

Hesaplamacı biyolog Yaniv Erlich’in Boston’da ki  yıllık  toplantıda İnsan Genetiklerinin içerisinde  Amerikan Halkını temsil eden çalışması,  şecere sitelerinden doğrudan alınmış büyük miktarlarda veriyi bir araya getirdi.

Tarihi olarak, araştırmacılar bu tür verilerin tozlu kayıtlarını elemek zorundaydılar, birkaç bin bireyden oluşan bir aile ağacını bir araya getirmek yılar alırdı. Fakat Erlich, doğum ve ölüm tarihleri de bulunan  43 milyon halk profilini kazıyıp çıkardı şecere web sitesi geni.com’dan alınmış  bazı yerler ve görüntülerde profillerde bulunmaktadır. Daha sonra Erich takımıyla birlikte bunları aile ağacına dahil etmiştir.

Bazıları bin kişi kadar küçük ailelerden oluşmaktaydı;  birisi ise 13 milyon kadar genişti.  Nature dergisinde geçmişte araştırmacılar için en iyisinin yüz bin bireyden oluştuğu daha küçük aile ağaçlarının var olduğu da rapor edilmiştir. Çığlık atmadan ve veri hakların için bağırmadan önce söylemeliyizki, mahremiyetin korunması için hepsi anonimleştirilmiştir- fakat bu, verilerin daha az kullanışlı olduğunu göstermiyor. 15. yüzyıla geri dönersek, bu fikir  iyi bilim yaratmak ve araştırmalar yapabilmek için ortaya atılmıştı.ku-bigpic

Başa çıkılması gereken bir sorun, bu ağaçların nasıl sorgulandığını ve onların sakladıkları gizin nasıl su yüzüne çıkarılacağı olmuştur: Umut verici vaatler de var: onların sadece yapıları bile demografik ve popülasyon genişlemeleri hakkında bize bir çok şey anlatır, ve tıbbi bilgilerle de bağlantılandırılırsa veya DNA sarmal verisiyle ilişkilendirilirse,  kalıtımlarını anlama konusundada bize çok faydalı yöntemler sunabilir.

Hep olduğu gibi, bazı ikazlarda bulunmaktadır.  Şecere verisi ile ilgili en büyük problem onun kendisini ele vermesi ve her zaman güvenilir olamamasıdır özellikle de senin geleceğinle alakalı olan konularda. Hala,  büyük veri kümelerinden   faydalanabilmek mümkün olmakta: en azından gürültülerden kendi  seslerini duyurabilecek kadar iyiler. Şimdilik bu kadar geniş aile ağacının neye faydalı olacağı tam açık değil  fakat, bunu araştırmak heyecan verici olacaktır. Bu arada hala niçin kendinize  bir aile ağacı oluşturmaya başlamıyorsunuz?