ISSN: 0974-276X
Abhishek Narain Singh*, Krishan Pal
In den Einzelzelldaten, die wir aus Experimenten erhalten, gibt es eine ausgeprägte technische Variabilität und eine große Anzahl fehlender Beobachtungen. Abgesehen davon hat jede der Experimentchargen eindeutig einen Chargeneffekt auf jede Zelle in der Charge. Dieser Chargeneffekt kann für die Imputation ausgenutzt werden, vorausgesetzt, dass alle Zellen in einer bestimmten Charge zum selben Gewebe gehören. Hier stellen wir „BaySiCle“ vor, eine neuartige Methode auf Grundlage der Bayesschen Inferenz, kombiniert mit dem Algorithmus des k-Nearest Neighbor zur Imputation fehlender Daten in scRNA-Sequenzzählungen. Die Vorhersagen werden basierend auf dem Expressionswert über alle Zellen hinweg für alle Einzelzellen derselben Charge ermittelt. Wir zeigen anhand von Beispiel-scRNA-Sequenzdatensätzen und simulierten Expressionsdaten, dass BaySiCle eine robuste Imputation fehlender Werte ermöglicht und realistische Transkriptverteilungen erzeugt, die mit Fluoreszenz- in-situ -Hybridisierungsmessungen einzelner Moleküle übereinstimmen. Durch die Verwendung von Vorhersagen, die aus den Datensatzstrukturen nicht nur im Versuchsaufbau-Batch, sondern auch in der gleichen Zellgruppe gewonnen wurden, verbessert BaySiCle die Genauigkeit der Imputation und kommt so viel näher an ähnliche Alternativen heran.