ISSN: 2161-0932
Rinehart John
Hintergrund: Klinische Entscheidungsdilemmata sind in der IVF-Praxis besonders bemerkenswert, da oft große Datensätze generiert werden, die es Klinikern ermöglichen, Vorhersagen zu treffen, die die Behandlungsentscheidungen beeinflussen. Diese Studie wendete maschinelles Lernen an, indem sie IVF-Daten verwendete, um das Risiko von Zwillingen zu bestimmen, wenn zwei oder mehr Embryonen für die Übertragung verfügbar sind. Während die meisten Klassifikatoren in der Lage sind, Schätzungen der Genauigkeit zu liefern, ging diese Studie noch einen Schritt weiter und verglich Klassifikatoren sowohl nach Genauigkeit als auch nach Fläche unter der Kurve (AUC).
Methoden: Die Studiendaten wurden aus einem großen elektronischen Krankenaktensystem abgeleitet, das von über 140 IVF-Kliniken verwendet wird und 135.000 IVF-Zyklen enthielt. Der Datensatz wurde von 88 Variablen auf 40 reduziert und umfasste nur jene IVF-Zyklen, in denen zwei oder mehr Blastozystenembryonen erstellt wurden. Die folgenden Klassifikatoren wurden hinsichtlich Genauigkeit und AUC verglichen: ein verallgemeinertes lineares Modell, lineare Diskriminanzanalyse, quadratische Diskriminanzanalyse, K-Nearest Neighbors, Support Vector Machine, Random Forests und Boosting. Außerdem wurde ein gestapelter Ensemble-Lernalgorithmus angewendet, um Vorhersagen von Klassifikatoren zur Erstellung eines neuen Modells zu verwenden.
Ergebnisse: Obwohl der Ensemble-Klassifikator am genauesten war, war keiner der Klassifikatoren den anderen Klassifikatoren deutlich überlegen. Die Ergebnisse zeigten, dass die Boosting-Methoden für Klassifikatoren schlecht funktionierten; Klassifikatoren mit logistischer und linearer Diskriminanzanalyse schnitten besser ab als der Klassifikator mit quadratischer Diskriminanzanalyse, und die Support Vector Machine schnitt fast so gut ab wie der Baumklassifikator. Die AUC-Ergebnisse stimmten mit den Genauigkeitsvergleichen überein. Eine externe Validierung wurde auch mit einem anderen Datensatz mit 588 Beobachtungen durchgeführt. Alle Modelle schnitten mit dem externen Validierungsdatensatz besser ab, wobei der Random-Forest-Klassifikator deutlich besser abschnitt als jeder andere Klassifikator.
Schlussfolgerungen : Diese Ergebnisse untermauern den Eindruck, dass Big Data im klinischen Entscheidungsprozess von Nutzen sein kann; dass jedoch kein einziger statistischer Algorithmus für alle Datenbanken maximale Genauigkeit bietet. Daher müssen verschiedene Datensätze untersucht werden, um zu bestimmen, welche Algorithmen für einen bestimmten Datensatz am genauesten sind. Diese Erkenntnisse unterstreichen die Annahme, dass Klinikärzte mit Zugriff auf große Datenmengen mithilfe fortschrittlicher prädiktiver Analysemodelle robuste klinische Informationen erstellen können, die für die Patientenversorgung von entscheidender Bedeutung sind.