ISSN: 0974-276X
Caroline Truntzer, Delphine Maucort-Boulch und Pascal Roy
Hintergrund: Hochdurchsatzanalysen wie die Massenspektrometrie für die klinische Proteomik bieten neue Einblicke in die klinische Forschung. Diese vielversprechende Technologie erzeugt hochdimensionale Datensätze mit einer enormen Menge an biologischem Input. Die Arbeit mit diesen hochdimensionalen Datensätzen hat statistische Methoden vor Herausforderungen gestellt, und es gibt immer noch Schwächen in der aktuellen statistischen Analyse, die überwunden werden müssen, um eine genaue Interpretation von „Omics“-Studien zu erhalten. Die zentrale Frage ist die einer zuverlässigen Identifizierung neuer prognostischer und diagnostischer Biomarker. Obwohl diese Mechanismen der Identifizierung und Validierung neuer Marker in früheren Studien beobachtet wurden, wurden sie unzureichend erklärt und oft getrennt.
Ergebnisse: Ziel unserer Studie war es daher, zu zeigen, wie Kandidatenmarker in Identifikationsstudien manchmal aufgrund verzerrter Schätzungen ihrer Wirkung ausgewählt werden. Um dieses Ziel zu erreichen, wurde diese Arbeit durch die Simulation hochdimensionaler Studien zum Überleben durchgeführt. Wir zeigten, wie der Auswahlmechanismus bei Identifikationsstudien einen Mechanismus namens Regression zum Mittelwert beeinflusst. Dies führt wiederum zu einer verzerrten Schätzung der Effektstärke und damit zu Optimismus bei der Betrachtung von Validierungsstudien.
Schlussfolgerungen: Diese Studie hat gezeigt, warum die Entdeckung neuer robuster Marker nur durch gut konzipierte Studien möglich ist, die sich auf konsistente Stichprobengrößen für den Identifizierungsschritt stützen. Aufgrund der oben genannten Identifizierungs- und Validierungsmechanismen erfordern relevante Kandidaten-Biomarker in hochdimensionalen klinischen Studien eine unvoreingenommene Schätzung, und zwar bereits beim Identifizierungsschritt. Nur dann führt dies zu konsistenten Studien und damit zu einem Nutzen im Hinblick auf die Gesundheitsversorgung.