Zeitschrift für Proteomik und Bioinformatik

Zeitschrift für Proteomik und Bioinformatik
Offener Zugang

ISSN: 0974-276X

Abstrakt

BaySiCle: Eine Bayesianische Inferenz Joint K-Nearest Neighbor Methode zur Imputation von Einzelzell-RNA-Sequenzierungsdaten unter Ausnutzung lokaler Effekte

Abhishek Narain Singh*, Krishan Pal

In den Einzelzelldaten, die wir aus Experimenten erhalten, gibt es eine ausgeprägte technische Variabilität und eine große Anzahl fehlender Beobachtungen. Abgesehen davon hat jede der Experimentchargen eindeutig einen Chargeneffekt auf jede Zelle in der Charge. Dieser Chargeneffekt kann für die Imputation ausgenutzt werden, vorausgesetzt, dass alle Zellen in einer bestimmten Charge zum selben Gewebe gehören. Hier stellen wir „BaySiCle“ vor, eine neuartige Methode auf Grundlage der Bayesschen Inferenz, kombiniert mit dem Algorithmus des k-Nearest Neighbor zur Imputation fehlender Daten in scRNA-Sequenzzählungen. Die Vorhersagen werden basierend auf dem Expressionswert über alle Zellen hinweg für alle Einzelzellen derselben Charge ermittelt. Wir zeigen anhand von Beispiel-scRNA-Sequenzdatensätzen und simulierten Expressionsdaten, dass BaySiCle eine robuste Imputation fehlender Werte ermöglicht und realistische Transkriptverteilungen erzeugt, die mit Fluoreszenz- in-situ -Hybridisierungsmessungen einzelner Moleküle übereinstimmen. Durch die Verwendung von Vorhersagen, die aus den Datensatzstrukturen nicht nur im Versuchsaufbau-Batch, sondern auch in der gleichen Zellgruppe gewonnen wurden, verbessert BaySiCle die Genauigkeit der Imputation und kommt so viel näher an ähnliche Alternativen heran.

Haftungsausschluss: Diese Zusammenfassung wurde mithilfe von Tools der künstlichen Intelligenz übersetzt und wurde noch nicht überprüft oder verifiziert.
Top