Schneller zum Target
Die biomedizinische Forschung hat ein Datenproblem. Wer es löst, kann Medikamente schneller und kosteneffektiver entwickeln. Besonders vielversprechend: Der Einsatz von Knowledge Graphen bei der Jagd auf Targets.
Die Medikamentenentwicklung verschlingt Milliarden. Trotzdem scheitern rund 90% der Wirkstoffe spätestens in der klinischen Testphase. Seit Jahrzehnten arbeiten Pharmaunternehmen daran, Prozesse der Drug Discovery zu verbessern und zu automatisieren. Dabei entstehen enorme Datenmengen.
Wie lassen sich so viele Informationen managen und sinnvoll miteinander verbinden?
Knoten & Kanten
Knowledge Graphen vernetzen Daten und schaffen einen zentralen Wissenshub, um investigativ zu forschen und – im Fall der Medikamentenentwicklung – schneller zu analysieren.
Das Datenmodell ist denkbar intuitiv: Daten sind als Knoten, die Verbindung als Kanten dargestellt. Beide können qualitative Eigenschaften besitzen. Ähnlich wie ein Familienstammbaum kann ein Graph sich also weit verzweigen, ohne an Transparenz zu verlieren. Beziehungen bleiben über mehrere Ebenen nachverfolgbar. Gleichzeitig offenbaren sich neue Zusammenhänge und Muster.
Über das Knoten-Kanten-Prinzip lassen sich kontinuierlich Daten hinzufügen. Der Knowledge Graph ist unbegrenzt skalierbar und repräsentiert damit in abfragbarer Weise die Komplexität des biologischen Gesamtwissens.
Novartis‘ Daten-Dreieck
Novartis nutzt einen Knowledge Graphen, um im Informationsdreieck aus Krankheit, Gen und Wirkstoff zu navigieren. Zur Konsolidierung der Datenquellen setzte der Pharmariese auf die Graphdatenbank Neo4j. Mit Hilfe von Text Mining extrahierte Novartis Informationen aus PubMed und verknüpfte sie mit etwa einer Milliarde historischer Datenpunkte. Eine Datapipeline sorgte für einen konstanten Zufluss an aktuellen Informationen aus klinischen Studien und Laborversuchen.
Novo Nordisks Data Science
Die Data Scientists von Novo Nordisk bauten mit Neo4j einen Knowledge Graphen für die Target Priorisierung bei kardiometabolischen Erkrankungen auf. Die Analyse übernehmen Graph-Algorithmen im Kontext vernetzter Daten: Shortest-Path ermittelt zum Beispiel die kürzeste Verbindung zwischen zwei Knoten (Gen-Krankheit). Googles PageRank zeigt die Bedeutung eines Gen für eine bestimmte Erkrankung an.
Vorhersage bei Astra Zeneca
Auch Astra Zeneca setzt bei der Drug Discovery auf Graphtechnologie. Der Pharmakonzern nutzt einen Neo4j-Knowledge Graphen, um alternative oder sogar neue Syntheserouten für Wirkstoffe vorherzusagen, die sich patentrechtlich schützen lassen. Im Datenkontext des Graphen können Forscher tiefer in die Analyse einsteigen und neue Wirkstoffkandidaten vorhersagen.
Mehr über Knowledge Graphen im Pharm- und Life-Science-Bereich auf neo4j.com.