ISSN: 0974-276X
USN Murty, Amit Kumar Banerjee und Neelima Arora
Wir treten in ein neues Zeitalter der datengesteuerten Welt ein und stehen vor der enormen Herausforderung, aus den Unmengen verfügbarer Daten Informationen abzuleiten. Die Menge der generierten Daten ist überwältigend und erfordert die Erforschung neuer und effektiver Methoden zur Clusterung und Klassifizierung solcher Daten. Die CAM- Kinase- Familie enthält bekanntermaßen viele Enzyme, die an wichtigen physiologischen Prozessen beteiligt sind. In der vorliegenden Studie wurden 13 wichtige physikochemischen Parameter für 56 Sequenzen der CAM-Kinase-Familie in silico berechnet. Selbstorganisierende Karten (SOM) wurden zur Klassifizierung und Clusterung ähnlicher Sequenzen und zur Visualisierung hochdimensionaler Datenräume eingesetzt, da sie für ihre Fähigkeit bekannt sind, das Wesentliche topologischer Beziehungen zwischen den Merkmalen beizubehalten. SOM ergab effektiv 4 Cluster, die sich voneinander unterschieden und durch charakteristische Merkmale gekennzeichnet waren.