Discovering Genomic Patterns Using Fuzzy Self Organizing Map

Teknologi barisan-mikro telah membolehkan pengumpulan beribu-ribu data genetik pada masa yang sama. Masalah yang dihadapi oleh data barisan-mikro adalah bilangan ciri yang banyak tetapi bilangan sampel yang sedikit. Pengerumunan menjadi pilihan yang praktikal dalam menganalisa data begini kerana...

Full description

Saved in:
Bibliographic Details
Main Author: Chu , Ho Yi
Format: Thesis
Language:English
Published: 2009
Subjects:
Online Access:http://eprints.usm.my/41262/1/Chun_Ho_Yi_24.pdf
http://eprints.usm.my/41262/
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Teknologi barisan-mikro telah membolehkan pengumpulan beribu-ribu data genetik pada masa yang sama. Masalah yang dihadapi oleh data barisan-mikro adalah bilangan ciri yang banyak tetapi bilangan sampel yang sedikit. Pengerumunan menjadi pilihan yang praktikal dalam menganalisa data begini kerana untuk mengkaji setiap satu data adalah tak praktis. Walapun terdapat berbilang jenis kaedah pengerumunan seperti “k-means” dan pengerumunan berpangkat, namun ini tidak mencukupi apabila menglibatkan set data yang sangat besar. Peta menyusun sendiri (SOM) adalah satu konsep yang diperkenalkan oleh Teuvo Kohonen yang membolehkan pengerumunan yang tidak diawasi dan penggambaran data. Penggambaran ini dilakukan dengan pemancaran data tersebut ke atas satu jaringan peta 2-dimensi sambil mengekalkan hubungan antara unit peta yang mewakili data tersebut. Lagipun, penggunaan satah komponen dalam SOM membolehkan analisis setiap ciri dan perhubungan antara ciri. Secara keseluruhan, pengerumunan dan penggambaran ini membolehkan analisis set data secara keseluruhan. Microarray technology has allowed for the collection of thousands of genetic data simultaneously. The problem with microarray data lies in the fact that while there are thousands of attributes, the number of samples is few. Clustering becomes a practical option in analysing such data as it is impractical to study every data individually. Although there are numerous clustering methods such as k-means and hierarchical clustering, it is insufficient when it comes to a massive scale dataset. Self-organising maps (SOM) is a concept introduced by Teuvo Kohonen that allowed for an unsupervised clustering and subsequent visualisation of data. This visualisation is by means of projecting the data onto a 2-dimensional map grid while retaining relations among map units that represent the data. Furthermore, the use of component planes in SOM allows for the analysis of individual attributes and correlation between attributes.