ISSN: 0974-276X
Elisa Robotti, Marcello Manfredi und Emilio Marengo
Die Entdeckung von Biomarkern ist eine Disziplin, die zunehmend an Bedeutung gewinnt, da sie diagnostische/prognostische Marker liefert und es ermöglicht, den Mechanismus der Entwicklung der Pathologie zu untersuchen und zu verstehen, was möglicherweise neue biomolekulare therapeutische Ziele aufzeigt. Die Entdeckung von Biomarkern in der Proteomik wird durch den Einsatz von Hochdurchsatztechniken erschwert, die eine große Anzahl von Kandidaten liefern, unter denen die wahren Biomarker gesucht werden müssen. Darüber hinaus steht oft nur eine kleine Anzahl von Proben zur Verfügung. Bei der Suche nach Biomarkern in solchen Datensätzen treten zwei Hauptprobleme auf: 1) die Identifizierung zuverlässiger Marker, um falsche Positivergebnisse aufgrund zufälliger Korrelationen zu vermeiden; 2) die erschöpfende Identifizierung aller Kandidatenmarker, um eine vollständige Momentaufnahme des untersuchten Effekts zu erhalten.
Biomarker können mit zwei Ansätzen identifiziert werden: klassische monovariate Methoden, bei denen jeder Biomarker als unabhängig betrachtet wird (Student's t-Test, Mann-Whitney-Test usw.) oder multivariate Methoden, die die Korrelationsstruktur der Daten (d. h. Wechselwirkungen) berücksichtigen können. Letztere sind sicherlich vorzuziehen und sollten den besten Kompromiss zwischen der besten Vorhersagekraft (erreicht durch die Verwendung von Verfahren zur Variablenauswahl) und Vollständigkeit erzielen. Hier überprüfen wir die neuesten Anwendungen multivariater Methoden zur Identifizierung von Biomarkern in der Proteomik, insbesondere im Hinblick auf die verwendeten statistischen Methoden.