Forschungsprojekt
Schnelle DNA-Bestimmung mit selbstlernenden Algorithmen
Für die personalisierte Medizin bilden genaue DNA-Analysen die wichtigste Grundlage. Was bei der Behandlung von Krebs-Tumoren bereits erfolgreich eingesetzt wird, kann dank der schnellen und somit kostengünstigen Basecaller-Lösung der OST auch für andere Behandlungen gezielt eingesetzt werden.
Im Bereich der Therapien finden aktuell grosse Umwälzungen statt durch die Erforschung und den Einsatz von so genannter personalisierter Medizin. Die Forschung bewegt sich vom allgemeinen «Medikament für eine bestimmte Krankheit» hin zum spezifischen «Medikament für jede Patientin oder jeden Patienten und dessen Krankheitsbild». Ein Beispiel dafür ist die Krebstherapie: DNA-Analysen des Tumor-Erbguts ermöglichen eine spezifische Medikation, die auf jede Patientin und jeden Patienten sowie dessen Diagnose individuell zugeschnitten werden kann. Die Individualisierung solcher Therapien führt zu deutlich verbesserten Behandlungsergebnissen.
Die Herausforderung: Entscheidende Verbesserung der DNA-Analyse
Damit dieses Vorgehen auch für die Behandlung anderer Krankheiten übernommen werden kann, muss die Analyse der DNA nicht nur weiter präzisiert werden, sondern auch schneller und damit kostengünstiger werden. Geschwindigkeit und Präzision sind bei der DNA-Analyse die wichtigsten Faktoren. Für eine komplette Sequenzierung menschlicher DNA müssen rund 3,2 Milliarden Basenpaare bestimmt werden, das sogenannte Basecalling.
Menschliche DNA besteht aus vier Bausteinen, den Nukleotiden. Jedes Nukleotid besteht aus Zucker, Phosphat und einer von vier verschiedenen Basen, entweder Adenin, Thymin, Guanin oder Cytosin. Für die Vision der personalisierten Medizin ist es notwendig, den Grossteil der relevanten Basenpaare fehlerfrei und schnell zu bestimmen.
So sieht DNA mit ihren vier paarweise angeordneten Basen im Detail aus. Beim Menschen besteht die DNA aus rund 3,27 Milliarden Basenpaaren.
Der Teufel steckt – wie so oft – im Detail. Denn die Analyse basiert auf einem Bildanalyse-Verfahren, das jeweils die dominante (hellste) Base erkennen und korrekt zuordnen muss. Das Problem dabei: Wenigstens 100 Lesezyklen sind für eine medizinisch verwendbare Analyse nötig, jedoch ist bereits nach 20 bis 40 Zyklen die visuelle Erkennung der richtigen Base kaum mehr möglich. Das menschliche Auge hätte keine Chance mehr, und selbst für einen Computer wird es sehr schwierig.
Die Lösung: der selbstlernende Analysealgorithmus
Am ICOM Institut für Kommunikationssysteme der OST wurde unter Leitung von Prof. Dr. Guido M. Schuster ein Verfahren entwickelt, das genau diese elementaren Schritte besser löst und dabei schneller und präziser arbeitet als die aktuell eingesetzten Verfahren. Das Basecaller-System der OST setzt auf Unsupervised Machine Learning, ein Verfahren, bei dem sich ein selbstlernender Algorithmus schrittweise selbst trainiert. Weil jeder Zyklus dem vorhergehenden biochemisch sehr ähnlich ist, kann das Verfahren zuverlässig den nächsten Zyklus prognostizieren. Ausgehend vom ersten Lesezyklus nutzt der Algorithmus das Konzept des iterativen (schrittweisen) Lernens und entwickelt auf diese Weise eine bisher unerreichte Genauigkeit.
Bereit für ein breites Einsatzgebiet
Dank der hohen Analysegeschwindigkeit arbeitet der Basecaller im Vergleich zu konventionellen Bestimmungsmethoden deutlich kostengünstiger und liefert dadurch eine optimale Lösung für den Einsatz nicht nur in neuen Therapienfeldern, sondern auch für den Einsatz in Gebieten mit höherem Therapiebedarf.
Details der Lösung sind mehrfach patentiert und der hohe Wirkungsgrad der Methode wurde unter anderem vom Broad Institute vom Massachusetts Institute of Technology und Harvard in Boston, USA, bestätigt. Der Basecaller wurde ausserdem mit dem Hauptpreis der Stiftung zur Förderung und Unterstützung technologieorientierter Unternehmungen Rapperswil (kurz: Stiftung FUTUR) ausgezeichnet. Der mit 10.000 Franken dotierte Preis wird jährlich für wissenschaftliche Innovationen mit gesellschaftlicher Relevanz vergeben. Anerkennungen wie diese unterstreichen, dass mit dem Basecaller der OST ein grosser Schritt in die Zukunft der personalisierten Medizin gelungen ist.
Nach 10 Lesezyklen (Reihe oben) lässt sich die dominante (hellste) Base noch mit blossem Auge erkennen. Nach 100 Lesezyklen (Reihe unten) ist das für einen Menschen nicht mehr möglich.
Projektteam:
Prof. Dr. Guido Schuster
ICAI Interdisciplinary Center for Artificial IntelligenceProfessor, Direktor ICAI
+41 58 257 45 13guido.schuster@ost.ch