Mikrobiologie trifft auf Informatik - Forschungsprojekt DiASPora zur Biodiversität von Bakterien erfolgreich im Leibniz-Wettbewerb
DiASPora zielt auf die verbesserte Integration, Zugänglichkeit und Handhabbarkeit von Informationen zur Biodiversität von Bakterien. Dabei werden vorhandene Informationen aus einer Vielzahl von Quellen – darunter mehr als 150 wissenschaftlichen Zeitschriften – gewonnen und aufbereitet. Prof. Dr. Jörg Overmann, Wissenschaftlicher Direktor des Leibniz-Instituts DSMZ in Braunschweig und Koordinator von DiASPora, erklärt: „Das Projekt nutzt die etablierte de.NBI-Datenbank BacDive, um die Daten in maschinenlesbarer Form zusammenzuführen und gut zugänglich zu machen. Parallel entwickeln wir neue bioinformatische Werkzeuge für multidimensionale Analysen dieser ganz verschiedenartigen molekularen, phänotypischen und ökologischen Daten. Damit wollen wir letztendlich die Eigenschaften von Bakterien vorhersagbar machen. Das Projekt leistet so einen besonderen Beitrag zur lebenswissenschaftlichen Forschung in Deutschland.“
Im Projekt werden Wissenschaftlerinnen und Wissenschaftler verschiedener Disziplinen mit ihren jeweils unterschiedlichen Methoden zusammenarbeiten. Sie bringen Kompetenzen aus Mikrobiologie, Informatik, semantischem Wissensmanagement, Datenwissenschaften, Software-Entwicklung, Text Mining und Bioinformatik mit. So kommen verschiedene, komplementäre Ansätze zusammen: manuelle Kuration, Text Mining, Schlussfolgerungen durch bioinformatische Methoden und maschinelles Lernen. „Im Projekt werden wir sowohl mit etablierten Methoden als auch mit neuen Tools arbeiten, um so die vielfältigen und heterogenen Informationen aufzufinden, zu standardisieren und anschließend zu verknüpfen“, erläutert Prof. Overmann. „Mit der Integration dieser Biodiversitätsinformationen durch Digitalisierung und modernste datenwissenschaftliche Methoden ermöglichen wir ganz neue wissenschaftliche Erkenntnisse und darauf aufbauend letztendlich neuartige praktische Anwendungen.“
Dabei spielt die semantische Datenvernetzung eine wichtige Rolle, wie Prof. Dr. Sören Auer (TIB) erläutert: „Durch den Einsatz von Vokabularen und Ontologien werden die mikrobiologischen Daten der BacDive-Datenbank mit Hilfe des Resource Description Framework (RDF) in ein maschinenlesbares Format umgewandelt. Anschließend werden die transformierten Daten verwendet, um einen Wissensgraphen zu erstellen, der innovative Suchmöglichkeiten für die Entdeckung neuer wissenschaftlicher Erkenntnisse und bis dato verborgener Datenbeziehungen ermöglicht.“
Die Begründung des Leibniz-Senatsausschusses Wettbewerb bescheinigt DiASPora, eine zeitgemäße Thematik von großer Bedeutung für die verschiedensten Bereiche von Umweltschutz bis hin zum Gesundheitswesen zu bearbeiten. Es sei sowohl innovativ und außerordentlich als auch sehr überzeugend. Das interdisziplinäre Forschungskonsortium sei als exzellent ausgewiesen, fachlich komplementär und verspreche hohe Synergien. Die beteiligten Partnerorganisationen seien hervorragend ausgewählt und böten einen herausragend geeigneten institutionellen Rahmen. „Wir freuen uns darauf, gemeinsam mit DSMZ und TIB dieses interdisziplinäre Projekt durchführen zu können“, stellt Prof. Dr. Konrad Förstner, bei ZB MED für das Projekt verantwortlich, fest. „Gemeinsam haben wir ein einzigartiges Paket von Expertisen geschnürt. Die gemeinsame Anwendung von Text Mining der Fachliteratur und bioinformatischen Methoden sowie die Überführung der Ergebnisse in maschinenlesbare Formate um den Wissensgraphen zu erweitern hat großes Potenzial, unser mikrobiologisches Wissen signifikant zu vergrößern."
Die Leibniz-Gemeinschaft fördert im Wettbewerbsverfahren verschiedene Programme, die der Erreichung ihrer strategischen Ziele im Rahmen des Paktes für Forschung und Innovation dienen. DiASPora wird im Programm Leibniz-Kooperative Exzellenz gefördert. In diesem Jahr haben sich 89 Antragstellende am Leibniz-Wettbewerb beteiligt; 27 Projekte werden in die Förderung aufgenommen.