Zum Inhalt
Fakultät Statistik

Probabilistische Modelle für Single-Cell-RNA-Sequenzierungsdaten

Trajectory- und Pseudo-Zeit-Inferenzmethoden bei der Single-Cell-RNA-Sequenzierung stehen vor der Herausforderung, dass die statischen Single-Cell-Transkriptom-Snapshot Daten nicht eindeutig sind.

In diesem Projekt wollen wir diese Herausforderung mit Hilfe von fortgeschrittenen probabilistischen Methoden angehen. Konkret wollen wir die unbeobachtete Zellanordnung als latente Pseudozeit rekonstruieren, indem wir die Anzahl der gespleißten RNA und die entsprechende abgeleitete RNA velocity analysieren. Darüber hinaus wollen wir mit Hilfe der Bayesianischen Inferenz Unsicherheitsschätzungen für die latente Zellanordnung erhalten.

Um diese Ziele zu erreichen, werden wir fortgeschrittene latente Gauß-Prozess-Modelle entwickeln, die in der Lage sind, abgeleitete Informationen zu nutzen, um die Präzision bei der Schätzung unbeobachteter latenter Inputs zu erhöhen. Dieses Modell verwendet abgeleitete Kovarianz-Kernel-Funktionen und Modifikationen in den Hyperparameter-Spezifikationen, wodurch die Möglichkeiten zur Nutzung abgeleiteter Informationen in einem Umfeld mit Multi-Output-Daten verbessert werden.

Obwohl die primäre Motivation in Anwendungen in der Single-Cell-Biologie liegt, hat dieses Modell das Potenzial, ähnliche Forschungsprobleme zu lösen, die sich mit Multi-Output-Daten und deren Ableitungen aus verschiedenen Studienbereichen befassen.

Projektmitglieder: Soham Mukherjee

Co-Supervisor: Manfred Claassen

Förderung: TU Dortmund