ISSN: 0974-276X
Hyunsu Ju, Allan R. Brasier, Alexander Kurosky, Bo Xu, Victor E. Reyes und David Y. Graham
Hintergrund: Die Entwicklung genauer Klassifizierungsmodelle hängt von den Methoden ab, die zur Ermittlung der relevantesten Variablen verwendet werden. Ziel dieses Artikels ist die Bewertung von Methoden zur Variablenauswahl, um wichtige Variablen bei der Vorhersage einer binären Antwort mithilfe nichtlinearer statistischer Modelle zu ermitteln. Unsere Ziele bei der Modellauswahl umfassen die Erstellung nicht überangepasster stabiler Modelle, die interpretierbar sind, genaue Vorhersagen generieren und eine minimale Verzerrung aufweisen. Diese Arbeit wurde durch Daten zu klinischen und Labormerkmalen von Helicobacter pylori-Infektionen motiviert, die von 60 Personen gewonnen wurden, die an einer prospektiven Beobachtungsstudie teilnahmen. Ergebnisse: Wir haben einen umfassenden Leistungsvergleich mehrerer nichtlinearer Klassifizierungsmodelle anhand des H. pylori-Datensatzes durchgeführt. Wir haben die Ergebnisse der Variablenauswahl anhand von multivariaten adaptiven Regressionssplines (MARS), logistischer Regression mit Regularisierung, verallgemeinerten additiven Modellen (GAMs) und bayesianischer Variablenauswahl in GAMs verglichen. Wir haben festgestellt, dass der MARS-Modellansatz die höchste Vorhersagekraft hat, da die Nichtlinearitätsannahmen der Kandidatenprädiktoren stark erfüllt sind, ein Ergebnis, das durch Devianz-Chiquadrat-Testverfahren in GAMs nachgewiesen wurde. Schlussfolgerungen: Unsere Ergebnisse legen nahe, dass die physiologischen freien Aminosäuren Citrullin, Histidin, Lysin und Arginin die wichtigsten Merkmale für die Vorhersage von H. pylori-Magengeschwüren auf der Grundlage der Aminosäureprofilierung sind.