Digital Approaches for the Synthesis of Poorly Accessible Biodiversity Information
DiASPora zielte auf die verbesserte Integration, Zugänglichkeit und Handhabbarkeit von Informationen zur Biodiversität von Bakterien. Dabei wurden vorhandene Informationen aus einer Vielzahl von Quellen – darunter mehr als 150 wissenschaftlichen Zeitschriften – gewonnen und aufbereitet.
Das Projekt nutzte die etablierte de.NBI-Datenbank BacDive, um die Daten in maschinenlesbarer Form zusammenzuführen und gut zugänglich zu machen. Parallel wurden neue bioinformatische Werkzeuge für multidimensionale Analysen dieser ganz verschiedenartigen molekularen, phänotypischen und ökologischen Daten entwickelt, um die Eigenschaften von Bakterien vorhersagbar zu machen.
Im Projekt arbeiteten Wissenschaftler:innen verschiedener Disziplinen mit ihren jeweils unterschiedlichen Methoden zusammen. Sie brachten Kompetenzen aus Mikrobiologie, Informatik, semantischem Wissensmanagement, Datenwissenschaften, Software-Entwicklung, Text Mining und Bioinformatik mit. So kamen verschiedene, komplementäre Ansätze zusammen: manuelle Kuration, Text Mining, Schlussfolgerungen durch bioinformatische Methoden und maschinelles Lernen.
Durch den Einsatz von Vokabularen und Ontologien wurden die mikrobiologischen Daten der BacDive-Datenbank mit Hilfe des Resource Description Framework (RDF) in ein maschinenlesbares Format umgewandelt. Anschließend wurden die transformierten Daten verwendet, um einen Wissensgraphen zu erstellen, der innovative Suchmöglichkeiten für die Entdeckung neuer wissenschaftlicher Erkenntnisse und bis dato verborgener Datenbeziehungen ermöglicht.
Aufgaben von ZB MED
Aktivierung von mikrobiologischem Wissen durch Text Mining wissenschaftlicher Literatur
Laufzeit
01.05.2020 – 31.08.2023
Drittmittelgeber
Leibniz-SAW, Programm Leibniz-Kooperative Exzellenz
Partner
- Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, Braunschweig (Projektkoordination)
- TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, Hannover