Solucan: Biyolojik Veri Madencisi ve Kişisel İlişkisel Veri Tabanı Yönetim Sistemi

M.Kamil TURAN
2009 Journal of Experimental and Clinical Medicine  
Genetik bilginin her gün değişen ve gelişen doğası bugün önemli bir soruna neden olmuştur. Aradığınız bilgi internette nerededir? O bilgiye nasıl ulaşabilirsiniz? Ulaştıktan sonra nasıl depolayabilirsiniz? Depolanan bilgileri nasıl güncel tutabilirsiniz? Şüphesiz bu soruların cevabını vermek genetik bilgi uzayının devasa yapısı düşünüldüğünde oldukça zor olacaktır. Bizim bu konudaki sorulara kısmi de olsa çözüm önerimiz Solucan ismini verdiğimiz yeni bir yazılımdır. Solucan, araştırmacının
more » ... istek ve öncelikleri doğrultusunda hazırladığı ilişkisel veri modelini, sizin istediğiniz ham veri kaynaklarından, sizin istediğiniz kurallar dizesini işletmek suretiyle bilgi grupları oluşturup otomatik olarak doldurmanızı sağlar. Ham veri kaynaklarının ve ilişkisel veritabanının sabit olmaması, bilgi elde etmek kurallarının da kullanıcı tarafından belirleniyor olması Solucan'ı etkin bir araç haline sokmuştur. Toplam 32004 gen için, ham veri kaynağımızdan, erişim numaralarını toparlayıp istediğimiz şekilde ilişkilendirmesi Solucan'ın yaklaşık 18 dakika 46 saniyesini almıştır. ABSTRACT Today, ever growing and changing nature of the genetic information has caused a serious problem. Where is the information, you are looking for, in the internet? How could you get that information? After getting it how would you store it? How would you keep that stored information up-to-date? In view of the monstrous structure of the genetic information space, there is no doubt that answering those questions will be very difficult. Our solution, even if it is a partial one, to the questions related to these topics is a new software that we called as the Worm (Solucan in Turkish). The Worm, let researchers fill the database model they prepare according to their desires and priorities, by running in line with series of their principles, forming information groups from row databases of their interests. Dynamic nature of row data sources and relational databases and the fact that the rules of information gathering are determined by the user marks the Worm as an effective tool. For a total of 32.004 genes, it took the Worm approximately 18 minutes and 46 seconds to gather from row data sources the accession numbers for these genes and associate them relationally as we wish.
doi:10.5835/jecm.omu.26.04.003 fatcat:i2mjvebtavgkjljsbejws4krma