Über IDEN Veröffentlichungen & Vorträge Mitglieder Kontakt Zum Anfang

Über IDEN

Ausgangssituation

In der medizinischen Forschung werden häufig individuelle Prognosen für Patienten und Patientinnen benötigt, bspw. für die Erfolgsaussicht einer Therapie. Diese werden aus statistischen Vorhersagemodellen abgeleitet. Ziel des Projektes ist es, das Potential von Methoden des Data Science für die Entwicklung und Nutzbarmachung von Vorhersagemodellen für die beiden folgenden Anwendungsgebiete aufzuzeigen:

  1. In Deutschland warten aktuell ca. 8.500 Personen auf ein Spenderorgan, die meisten davon auf eine Niere. Um vor dem Hintergrund dieser Knappheit mit den zur Verfügung stehenden Organen die bestmöglichen Ergebnisse erzielen zu können, können individuelle Akzeptanzkriterien definiert werden. Die Entscheidung über die Akzeptanz eines Spenderorgans könnte durch eine individualisierte Prognose unterstützt werden.
  2. In der onkologischen klinischen Forschung gewinnt die personalisierte Medizin zunehmend an Bedeutung. Statt Therapien für große, heterogene Patientengruppen zu entwickeln, wird versucht, über die Identifikation von Biomarkern personalisierte Therapieempfehlungen zu generieren. Vorhersagemodelle können helfen, Patientengruppen zu identifizieren, die besonders von der Therapie profitieren.

Ziele

Das Projekt leistet einen Beitrag zur Entwicklung und Verfügbarmachung von Prognosemodellen für die genannten Fragestellungen. Im Falle der Organtransplantation geht es konkret darum, Entscheidungen bei der individuellen Auswahl von Akzeptanzkriterien an ein Spenderorgan zu unterstützen.

Neue Entwicklungen des Maschinellen Lernens erlauben das Lernen auch komplexer Zusammenhänge durch die simultane Modellierung einer Vielzahl prognostischer oder prädiktiver Faktoren. In der Anwendung auf klinische Studien und medizinische Register bieten diese Techniken die Möglichkeit, im Akutfall individualisierte Prognosen für Patienten und Patientinnen abzuleiten und somit die Entwicklung neuer Therapieoptionen zu unterstützen. Für die Patienten und Patientinnen selbst ist dabei die oft relevanteste Frage, inwieweit durch die Wahl einer bestimmten Therapiestrategie ein unerwünschtes Ereignis verzögert oder sogar verhindert werden kann. Zensierungen, die bei diesen Fragestellungen üblicherweise auftreten, erfordern dabei eine besondere methodische Berücksichtigung, die in anderen großen Anwendungsfeldern des maschinellen Lernens (bspw. Industrie 4.0, Marketing, IT-Security) nur selten von Interesse sind. Entsprechend bleiben Fragen zur praktischen Umsetzung und zum geeigneten Ergebnistransfer unbeantwortet.

Diese Lücke soll das vorliegende Forschungsvorhaben schließen. Ein besonderer Fokus liegt dabei darauf, die statistische Information laienverständlich, erklärbar, nachvollziehbar sowie visualisiert transferieren zu können. So soll eine transparente Entscheidungsgrundlage für die Akzeptanz von Spendernieren und die Auswahl von Subgruppen mit besonderem Therapieansprechen bereitgestellt werden.

Vorgehen

Es wird identifiziert, welche maschinellen Lernverfahren aktuell in beiden Fragestellungen eingesetzt werden und wie zensierte Beobachtungen berücksichtigt werden. Daraufhin wird untersucht, inwieweit Zensierungen durch geeignete Gewichtung in maschinellen Lernverfahren berücksichtigt werden können. In Simulationsstudien wird dieser Ansatz evaluiert und ggf. weiterentwickelt.

In klinischen Studien mit kleinen bis moderaten Fallzahlen könnte der Einsatz maschineller Lernverfahren auch kontraproduktiv sein und zu einer einer niedrigen Reproduzierbarkeit führen. Das sog. ABC-Verfahren wurde bereits erfolgreich für die Selektion eingesetzt, um überoptimistische Ergebnisse zu verhindern, wie sie bspw. durch Dichotomisierung eines prädiktiven Biomarkers entstehen können. Daher werden im nächsten Schritt maschinelle Lernmethodik und ABC-Ansatz kombiniert. Die identifizierten Verfahren werden an medizinischen Daten, z.B. aus dem Deutschen Transplantationsregister, angewandt. Wir folgen dem Standard CRISP-DM für das Vorgehen in Data-Mining-Projekten.

Über die h_da

Die Hochschule Darmstadt (h_da) ist eine der größten Hochschulen für Angewandte Wissenschaften (HAW) in Deutschland. Über 70 Bachelor-, Diplom-, und Masterstudiengänge mit vielfach selbst wählbaren Schwerpunkten bieten beste Berufsaussichten für ihre rund 17.000 Studierenden.

Die h_da und acht Partner-Hochschulen aus ganz Europa arbeiten gemeinsam an der Vision eines neuen Hochschultyps – der Europäischen Hochschule. Seit 2020 fördert die EU-Kommission unser Bestreben, langfristig zur „European University of Technology“, kurz EUt+, zusammenzuwachsen.

Förderung und Laufzeit

Dieses Projekt wird seit 2023 aus Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) unter dem Förderkennzeichen 13FH019KX1 gefördert. Die Verantwortung für den Inhalt dieses Internetauftritts liegt bei der Autorin/beim Autor.

Veröffentlichungen & Vorträge

  • Stahl, H. (2024). Strategies for identifying subgroups in clinical studies and for correcting selection bias. Cartagena: II Workshop on Statistical Data Science
  • Klein, L. (2024). Bias of Machine Learning Classification in the Context of Right-Censored Survival Data – a Simulation Study. Cartagena: II Workshop on Statistical Data Science
  • Mirshanova, D. (2024). Anforderungsanalyse, Konzeption und Evaluierung eines registerdatengestützten Entscheidungsunterstützungssystems für Nierentransplantationen. Darmstadt: Abschlussarbeit B. Sc.
  • Klein, L. (2024). Oversimplifying machine learning on event time data - results of a literature and software review. Lübeck: 70th Biometric Colloquium
  • Jahn, A. (2023). Inverse Probability of Censoring Weighting in Machine Learning. Hamburg: Seminarreihe des Instituts für Medizinische Biometrie und Epidemiologie der Universitätsklinik Hamburg
  • Wies, C., Miltenberger, R., Grieser, G. & Jahn, A. (2023). Exploring the variable importance in random forests under correlations: a general concept applied to donor organ quality in post-transplant survival. London: BMC Med Res Methodol. doi: https://doi.org/10.1186/s12874-023-02023-2
  • Klein, L. (2023). The best of two worlds - A systematic comparison of time-to-event model implementations between R and Python. Basel: CEN2023
  • Klein, L. (2023). The best of two worlds - A systematic comparison of time-to-event model implementations between R and Python. Darmstadt: EUt+ Workshop on Statistical Data Science

Mitglieder

Projektleitung

Prof. Dr. Antje Jahn: Professorin für Statistik und Data Science am Fachbereich Mathematik der h_da

Prof. Dr. Gunter Grieser: Professor für Theoretische Informatik und Künstliche Intelligenz am Fachbereich Informatik der h_da

Mitarbeiter

Lukas Klein: Projektmitarbeiter (h_da), kooperativ promovierend an der Martin-Luther-Universität Halle-Wittenberg

Henrik Stahl: Projektmitarbeiter (h_da), Masterstudent Angewandte Mathematik

Fernando Ferreira Azevedo: Studentische Hilfskraft

Shams Kabir: Studentische Hilfskraft

Kooperationspartner

Die h_da ist projektverantwortlich und koordiniert die Kooperation. Mit Accso arbeiten wir an den Prototypen für die Entscheidungsunterstützung bei der Organtransplantation. Merck trägt zu der Forschung an Subgruppenidentifikationsmethoden bei. Die DSO bringt ihr Fachwissen zu dem Prozess der Organtransplantation in das Projekt ein und vermittelt medizinische Fachkontakte.